JPH10334183A - Black-and-whilte inverted area discriminating device and table recognition device using the same - Google Patents

Black-and-whilte inverted area discriminating device and table recognition device using the same

Info

Publication number
JPH10334183A
JPH10334183A JP9142708A JP14270897A JPH10334183A JP H10334183 A JPH10334183 A JP H10334183A JP 9142708 A JP9142708 A JP 9142708A JP 14270897 A JP14270897 A JP 14270897A JP H10334183 A JPH10334183 A JP H10334183A
Authority
JP
Japan
Prior art keywords
black
area
white inversion
white
line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9142708A
Other languages
Japanese (ja)
Other versions
JP3409992B2 (en
Inventor
Satoshi Naoi
聡 直井
Atsuko Obara
敦子 小原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP14270897A priority Critical patent/JP3409992B2/en
Publication of JPH10334183A publication Critical patent/JPH10334183A/en
Application granted granted Critical
Publication of JP3409992B2 publication Critical patent/JP3409992B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Document Processing Apparatus (AREA)

Abstract

PROBLEM TO BE SOLVED: To accurately discriminate, specially, a black-and-white inverted area and to perform table recognition according to the discrimination result as to the recognition device which recognizes image data in table format such as a document. SOLUTION: Image data read by a scanner, etc., are stored in an image area storage part 31 through an image input part 30, a segment extraction part 32 uses a segment extraction mask for the image data to segment local areas, and a segment integration part 33 integrates segments whose black pixels in the area exceed a specific quantity value horizontally and vertically; and a black-and-white area determination part 35 discriminates segments above a certain threshold among the integrated segments as a black-and-white inverted area, thereby determining an area where black-and-white inverted areas overlap, for example, horizontally and vertically as a black-and-white inverted area. Further, a ruled-line extraction part 34 recognizes a table such as a document according to extracted ruled lines and the black-and-white inverted area.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は帳票等の表形式の画
像データをスキャナ等の入力装置で入力し、該画像デー
タに対して表認識処理を行う際使用する白黒反転領域識
別装置、及びその装置を使用する表認識装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a black-and-white inversion area discriminating apparatus for inputting tabular image data such as a form using an input device such as a scanner and performing table recognition processing on the image data. The present invention relates to a table recognition device using a device.

【0002】[0002]

【従来の技術】近年、原稿上の文字や帳票フォームをイ
メージデータとしてコンピュータに供給する装置として
スキャナ等の入力装置が広く使用されている。また、こ
のような入力装置から供給された表を含むイメージデー
タは、画像認識装置により文字や罫線として認識され、
対応する文字コードやベクトルデータとして例えばコン
ピュータ内に記憶される。
2. Description of the Related Art In recent years, an input device such as a scanner has been widely used as a device for supplying a computer with characters and forms on a document as image data. Further, image data including a table supplied from such an input device is recognized as characters and ruled lines by an image recognition device,
It is stored in a computer, for example, as a corresponding character code or vector data.

【0003】上述のような画像認識装置の中で、罫線の
ように比較的細く、上下又は左右に長いラインを有する
表を認識するため、特にランを使用した表認識装置(特
開平6-33790)が提案されている。この装置は、
図34に示すように画像入力部101から画像領域10
2に表画像を入力し、該入力画像に対し、実線ラン抽出
部103により縦、横2方向のランを使用し、一定の長
さ以上の線分抽出し、それらを連結することにより罫線
を抽出するものである。また、抽出された罫線のうち、
幅がしきい値以上の罫線で囲まれた部分を白黒反転候補
として白黒反転セル候補抽出部104に出力する。そし
て、白黒反転セル決定部105では抽出した白黒反転セ
ル候補の内部の黒画素の密度が、例えば50%以上であ
れば、対応する領域(セル)を白黒反転セルと認定し、
画素反転部106によって当該セルに対し白黒反転処理
を行うものである。
[0003] Among the above-mentioned image recognition apparatuses, in order to recognize a table having a relatively thin line such as a ruled line and a long line vertically and horizontally, a table recognition apparatus using a run (Japanese Patent Laid-Open No. 6-33790) is particularly preferred. ) Has been proposed. This device is
As shown in FIG. 34, from the image input unit 101 to the image area 10
2, a line image having a certain length or more is extracted from the input image using two runs in the vertical and horizontal directions by the solid line run extraction unit 103, and a ruled line is formed by connecting them. It is to extract. Also, among the extracted ruled lines,
A portion surrounded by a ruled line having a width equal to or larger than the threshold value is output to the black-and-white inverted cell candidate extraction unit 104 as a black-and-white inverted cell candidate. When the density of black pixels inside the extracted black-and-white inverted cell candidate is, for example, 50% or more, the black-and-white inverted cell determination unit 105 identifies the corresponding area (cell) as a black-and-white inverted cell,
The pixel inversion unit 106 performs a black-and-white inversion process on the cell.

【0004】尚、上述の白黒反転処理後、白黒反転領域
に書き込まれたデータに対して文字の切り出し処理を行
い、切り出した文字に対して認識処理を行う。
After the above-described black-and-white inversion processing, a character cutout processing is performed on the data written in the black-and-white inversion area, and a recognition processing is performed on the cut-out characters.

【0005】[0005]

【発明が解決しようとする課題】上記従来の表認識装置
では以下の問題が発生する。 (イ)先ず、従来例の表認識装置では、図35(a)に
示すように、長い横ラン及び縦ランを使用するので同図
(b)に示すように1つのセル内が全て白黒反転画像で
構成されている場合には問題ないが、例えば同図(c)
に示すように、1つのセル内に白黒反転領域と通常セル
領域が混在する場合問題となる。すなわち、同図(c)
に示す例に対し、同図(a)の長さの横ラン及び縦ラン
を使用して黒画素数を計数する場合、白画素数が極めて
多くなり、正確な黒画素数を計数できない。このため白
黒反転領域の識別を誤る。 (ロ)また、従来例の表認識装置では、図35(a)に
示すように、長い横ラン、及び縦ラン(例えば、同図
(b)に示す白黒反転領域の長さと同じ長さの横ラン、
及び縦ラン)を使用するので、認識するセルの横及び縦
の長さが異なる白黒反転領域を認識する場合、正確な黒
画素数の計数ができない。例えば、同図(a)に示すよ
うに、横ランの長さをL1とし、縦ランの長さをL2と
する時、認識する白黒反転セルの横幅が上記L1より長
く、又縦幅が上記L2より長い場合、やはり白画素数が
多くなり、正確な白黒反転領域の識別ができない。
However, the above-mentioned conventional table recognition apparatus has the following problems. (A) First, in the conventional table recognition apparatus, as shown in FIG. 35A, a long horizontal run and a vertical run are used. Therefore, as shown in FIG. There is no problem if the image is composed of images, for example, FIG.
As shown in (1), a problem arises when a black-and-white inversion area and a normal cell area are mixed in one cell. That is, FIG.
When the number of black pixels is counted using the horizontal run and the vertical run having the length shown in FIG. 3A, the number of white pixels becomes extremely large, and the accurate number of black pixels cannot be counted. For this reason, the identification of the black-and-white inversion area is incorrect. (B) In the conventional table recognition device, as shown in FIG. 35A, a long horizontal run and a vertical run (for example, the same length as the length of the black-and-white inversion area shown in FIG. Horizontal run,
And vertical run), it is not possible to accurately count the number of black pixels when recognizing a black-and-white inversion area having different horizontal and vertical lengths of the cell to be recognized. For example, as shown in FIG. 3A, when the length of the horizontal run is L1 and the length of the vertical run is L2, the width of the black-and-white inverted cell to be recognized is longer than L1 and the vertical width is L1. If the length is longer than L2, the number of white pixels also increases, and it is not possible to accurately identify a black-and-white inversion area.

【0006】また、同様なことは白黒反転セル領域内の
文字サイズが大きい場合にも生じる。すなわち、この場
合同図(b)に示す文字列「会社名」の白抜き文字の文
字サイズが大きい場合であり、横ラン又は縦ランに従っ
て黒画素数を計数すると白抜き文字部分が大きいため、
黒画素数の計数値が少なくなり、正確な白黒反転領域
(白黒反転セル)の認識ができない。 (ハ)さらに、スキャナーによる帳票フォーム等の表画
像の読み出し処理が、例えば傾いた状態で行われた場
合、白黒反転領域に傾きが生じており、傾きのない長い
横ラン、及び縦ランを用いて黒画素数を計数すること
は、誤った(より少ない)数の黒画素数を計数すること
になり、白黒反転セルの認識を誤る結果となる。
[0006] A similar situation occurs when the character size in the black-and-white inverted cell area is large. That is, in this case, the character size of the white character of the character string “company name” shown in FIG. 7B is large, and the white character portion is large when the number of black pixels is counted according to the horizontal run or the vertical run.
The count value of the number of black pixels is reduced, and it is not possible to accurately recognize a black-and-white inverted area (black-and-white inverted cell). (C) Furthermore, when the reading process of a table image such as a form by a scanner is performed, for example, in a tilted state, the black-and-white inversion area is tilted, and a long horizontal run and a vertical run without tilt are used. Counting the number of black pixels by counting results in counting the wrong (smaller) number of black pixels, resulting in erroneous recognition of the black-and-white inverted cell.

【0007】かかる場合、例えば横ラン、及び縦ランを
同じ角度だけ傾けて計数処理を行うことが必要である。
しかし、このような傾き補正には煩雑な処理が必要とな
る。本発明は上記課題を解決するため、水平方向に短い
線分抽出マスク、及び垂直方向に短い線分抽出マスクを
使用し、当該線分抽出マスクに含まれる黒画素数を計数
し且つ統合処理し、統合線分の線幅が所定の閾値を越え
る場合白黒反転候補領域とし、当該白黒反転候補領域を
水平方向及び垂直方向に作成し、これらを例えば線分セ
グメント列で囲った領域を白黒反転領域とすることで、
上記(イ)〜(ハ)の課題を解決する白黒反転領域識別
装置、及びその装置を使用する表認識装置を提供するも
のである。
In such a case, for example, it is necessary to perform the counting process by inclining the horizontal run and the vertical run by the same angle.
However, such inclination correction requires complicated processing. In order to solve the above problem, the present invention uses a short line segment extraction mask in the horizontal direction and a short line segment extraction mask in the vertical direction, and counts and integrates the number of black pixels included in the line segment extraction mask. If the line width of the integrated line segment exceeds a predetermined threshold value, it is determined as a black-and-white inversion candidate area, and the black-and-white inversion candidate area is created in the horizontal direction and the vertical direction. By doing
It is an object of the present invention to provide a black-and-white inversion area identification device that solves the above-mentioned problems (a) to (c), and a table recognition device that uses the device.

【0008】[0008]

【課題を解決するための手段】請求項1記載の発明は上
記課題を解決するため、表形式の2値イメージデータに
対し、水平方向に長い線分抽出マスクを用いて水平方向
に走査し、垂直方向に長い線分抽出マスクを用いて垂直
方向に走査し、黒画素密度が所定の閾値より高い領域を
それぞれ抽出する領域抽出手段と、該領域抽出手段で抽
出した前記黒画素密度の高い領域をそれぞれのマスク走
査方向に直交する方向で統合する第1の統合手段と、該
第1の統合手段で統合した領域の線幅が所定の閾値以上
であれば白黒反転候補領域であるとし、該白黒反転候補
領域をそれぞれのマスク走査方向に統合する第2の統合
手段と、該第2の統合手段で統合した白黒反転候補領域
の輪郭に対し、水平方向及び垂直方向の線分セグメント
列を作成する線分セグメント列作成手段と、該線分セグ
メント列作成手段で作成された水平方向の線分セグメン
ト列と垂直方向の線分セグメント列で囲まれた領域を白
黒反転領域に設定する白黒反転領域設定手段とを備えた
白黒反転領域識別装置を提供することによって達成でき
る。
According to the first aspect of the present invention, in order to solve the above-described problems, binary image data in a table format is scanned in a horizontal direction using a line segment extraction mask that is long in the horizontal direction, Region extracting means for scanning in a vertical direction using a line segment extraction mask which is long in the vertical direction, and extracting regions in which the black pixel density is higher than a predetermined threshold value; and the region in which the black pixel density extracted by the region extracting means is high. A first integration unit that integrates in a direction orthogonal to the respective mask scanning directions, and if the line width of the region integrated by the first integration unit is equal to or greater than a predetermined threshold, the region is determined to be a black-and-white inversion candidate region. Second integration means for integrating the black-and-white inversion candidate areas in the respective mask scanning directions, and horizontal and vertical line segment segments for the contours of the black-and-white inversion candidate areas integrated by the second integration means Line segment And a black-and-white inversion area setting means for setting an area surrounded by the horizontal line segment segments and the vertical line segment segments created by the line segment segment generation means as a black-and-white inversion area. This can be achieved by providing a black-and-white inversion area identification device provided with:

【0009】すなわち、本例は水平方向に長い、縦×横
(m×n)が例えば、1×6、1×15、1×30等)
の線分抽出マスクを使用し、水平方向に順次一定ドット
毎に走査し、当該線分抽出マスクで切り取られる矩形領
域内に所定の閾値以上の黒画素が含まれている時、当該
領域を上記水平方向に直交する方向に統合し、該統合結
果によって所定の閾値以上の線幅であれば白黒反転候補
領域とし、更に第2の統合手段によって当該白黒反転候
補領域の領域(線分)を水平方向に延長する。
That is, in this embodiment, the length is long in the horizontal direction and the length × width (m × n) is, for example, 1 × 6, 1 × 15, 1 × 30, etc.)
The line segment extraction mask is used to sequentially scan every fixed dot in the horizontal direction, and when a rectangular region cut out by the line segment extraction mask includes black pixels of a predetermined threshold or more, the region is scanned as described above. If the line width is equal to or greater than a predetermined threshold value based on the result of the integration, the area is regarded as a black-and-white inversion candidate area, and the area (line segment) of the black-and-white inversion candidate area is horizontally set by the second integration means. Extend in the direction.

【0010】一方、垂直方向に対しても同様の処理を行
い、垂直方向に長いm×n(例えば、6×1、15×
1、30×1等)の線分抽出マスクを使用し、垂直方向
に順次一定ドット毎に走査し、当該線分抽出マスクで切
り取られる領域内に所定の閾値以上の黒画素が含まれて
いる時、当該領域(線分)を上記垂直方向に直交する方
向に統合し、該統合結果得られる線幅が所定の閾値以上
の線幅であれば白黒反転候補領域とし、更に第2の統合
手段によって当該白黒反転候補領域の線分を垂直方向に
延長する。
On the other hand, the same processing is performed in the vertical direction, and a vertical m × n (for example, 6 × 1, 15 ×
Using a line segment extraction mask of (1, 30 × 1 etc.), scanning is performed sequentially at regular intervals in the vertical direction at regular intervals, and a region cut out by the line segment extraction mask contains black pixels of a predetermined threshold or more. At this time, the area (line segment) is integrated in a direction orthogonal to the vertical direction, and if the line width obtained as a result of the integration is a line width equal to or greater than a predetermined threshold, the area is determined as a black-and-white inversion candidate area. Thus, the line segment of the black-and-white inversion candidate area is extended in the vertical direction.

【0011】そして、上記水平方向及び垂直方向に作成
した白黒反転候補領域に対し、それぞれの輪郭を示す線
分セグメント列を水平方向、垂直方向に作成し、このよ
うにして作成された線分セグメント列で囲われた領域を
白黒反転領域とする。
[0011] Then, for the black-and-white reversal candidate area created in the horizontal and vertical directions, line segment segments indicating the respective contours are created in the horizontal and vertical directions. The area enclosed by the rows is a black-and-white inversion area.

【0012】このように本請求項1記載の発明は、水平
方向に極めて細く(例えば1ドット)、且つ比較的短い
(例えば6ドット、15ドット、30ドット)線分抽出
マスクを使用し、また垂直方向に極めて細く(例えば1
ドット)、且つ比較的短い(例えば6ドット、15ドッ
ト、30ドット)線分抽出マスクを使用し、黒画素数の
多い領域を統合して白黒反転領域を識別するものであ
り、一つのセル内の一部に白黒反転領域が存在する場合
でも正確にその領域を識別することができる(前記課題
(イ)の解決)。また、白黒反転領域内に大きいサイズ
の反転文字が存在する場合でも、上記のように本例で使
用する線分抽出マスクは極めて細く比較的短い線分抽出
マスクを使用するので白黒反転領域を正確に識別するこ
とができる(前記課題(ロ)の解決)。さらに、表画像
が傾いて読み出された場合でも、狭い範囲の黒画素数を
認識しつつ統合処理により白黒反転領域を識別するの
で、傾いた線分として認識でき、傾斜のある状態の白黒
反転領域として認識できる(前記課題(ハ)の解決)。
As described above, the invention according to claim 1 uses a line segment extraction mask which is extremely thin (for example, 1 dot) and relatively short (for example, 6 dots, 15 dots, 30 dots) in the horizontal direction. Extremely thin in the vertical direction (for example, 1
(Dots) and relatively short (for example, 6 dots, 15 dots, and 30 dots) line segment extraction masks are used to integrate regions with a large number of black pixels to identify a black-and-white inversion region. Even if a black-and-white inversion area exists in a part of the area, the area can be accurately identified (solution of the above-mentioned problem (a)). Even when a large size inverted character exists in the black-and-white inversion area, the line-slice extraction mask used in this example uses an extremely thin and relatively short line-segment extraction mask as described above. (Solution of the above problem (b)). Furthermore, even when the front image is read with an inclination, the black-and-white inversion area is identified by the integration processing while recognizing the number of black pixels in a narrow range, so that it can be recognized as an inclined line segment, and the black-and-white inversion in an inclined state. It can be recognized as an area (solution of the above problem (c)).

【0013】請求項2記載の発明は上記課題を解決する
ため、表形式の2値イメージデータに対し、水平方向に
長い線分抽出マスクを用いて水平方向に走査し、垂直方
向に長い線分抽出マスクを用いて垂直方向に走査し、黒
画素密度が所定の閾値より高い領域をそれぞれ抽出する
領域抽出手段と、該領域抽出手段で抽出した前記黒画素
密度の高い領域をそれぞれのマスク走査方向に直交する
方向で統合する第1の統合手段と、該第1の統合手段で
統合した領域の線幅が所定の閾値以上であれば白黒反転
候補領域であるとし、該白黒反転候補領域をそれぞれの
マスク走査方向に統合する第2の統合手段と、該第2の
統合手段で統合した水平方向の白黒反転候補領域と垂直
方向の白黒反転候補領域の重なり状態により白黒反転領
域を設定する白黒反転領域設定手段とを備えた白黒反転
領域識別装置を提供することによって達成できる。
According to a second aspect of the present invention, in order to solve the above-described problem, binary image data in a table format is scanned in a horizontal direction using a line segment extraction mask that is long in a horizontal direction, and a line segment that is long in a vertical direction is scanned. An area extraction unit that scans in the vertical direction using an extraction mask to extract regions in which the black pixel density is higher than a predetermined threshold, and extracts the regions in which the black pixel density is high extracted by the region extraction unit in the respective mask scanning directions. A first integrating means for integrating in a direction orthogonal to the direction, and if the line width of the area integrated by the first integrating means is equal to or greater than a predetermined threshold, the area is determined to be a black-and-white inversion candidate area. A black-and-white inversion area is set based on the overlapping state of the horizontal black-and-white inversion candidate area and the vertical black-and-white inversion candidate area integrated by the second integration means. It can be achieved by providing a rolling tone reversal region identification apparatus provided with an area setting means.

【0014】すなわち、本例は上記請求項1記載の発明
が白黒反転候補領域の輪郭に対し線分セグメント列を作
成し、当該線分セグメント列で囲まれた領域を白黒反転
領域であると識別したのに対し、本例の発明は水平方向
の白黒反転候補領域と垂直方向の白黒反転候補領域の重
なり状態により白黒反転領域を識別する構成である。
That is, in this embodiment, the invention described in claim 1 creates a line segment segment row for the outline of the black and white reversal candidate area, and identifies an area surrounded by the line segment segment row as a black and white reversal area. On the other hand, the invention of this example has a configuration in which the black-and-white inversion area is identified based on the overlapping state of the horizontal and black-and-white inversion candidate areas in the horizontal direction and the vertical and black-and-white inversion candidate areas.

【0015】すなわち、本例も水平方向に長いm×nの
線分抽出マスクを使用し、水平方向に順次一定ドット毎
に走査し、当該線分抽出マスクで切り取られる矩形領域
内に所定の閾値以上の黒画素が含まれている時、当該矩
形領域を上記水平方向に直交する方向に統合し、該統合
結果、所定の閾値以上の線幅であれば白黒反転候補領域
とし、また垂直方向に対しても同様の処理を行い、垂直
方向に長い線分抽出マスクを使用し、垂直方向に順次一
定ドット毎に走査し、当該線分抽出マスクで切り取られ
る矩形領域内に所定の閾値以上の黒画素が含まれている
時、当該矩形領域を上記垂直方向に直交する方向に統合
し、該統合結果、所定の閾値以上の線幅であれば白黒反
転候補領域とする。
That is, this embodiment also uses a horizontally long mxn line segment extraction mask, sequentially scans in the horizontal direction at regular intervals, and sets a predetermined threshold value within a rectangular area cut by the line segment extraction mask. When the above black pixels are included, the rectangular area is integrated in the direction orthogonal to the horizontal direction, and if the integrated result indicates that the line width is equal to or greater than a predetermined threshold, the area is regarded as a black-and-white inversion candidate area, and in the vertical direction. The same processing is performed for the vertical direction, using a long line segment extraction mask, sequentially scanning in the vertical direction at a constant dot interval, and setting a black area of a predetermined threshold or more within a rectangular area cut by the line segment extraction mask. When pixels are included, the rectangular areas are integrated in a direction orthogonal to the vertical direction, and if the integrated result indicates that the line width is equal to or greater than a predetermined threshold, the area is determined as a black-and-white inversion candidate area.

【0016】そして、上記水平方向及び垂直方向に作成
した白黒反転候補領域に対し、その重なり状態を判断
し、白黒反転領域の識別を行う。例えば、この重なりの
状態は水平、垂直両方向の白黒反転領域が重なり合う領
域面積を、一方(水平方向又は垂直方向の何れか一方)
方向の白黒反転領域の面積で割り算した値が所定の閾値
以上である場合、当該水平、垂直両方向の白黒反転領域
で囲まれた領域を白黒反転領域とする。このように構成
することにより、白黒反転領域を正確に識別でき、前記
課題(イ)〜(ハ)を解決することができる。
Then, the overlapping state of the black-and-white inversion candidate areas created in the horizontal direction and the vertical direction is determined, and the black-and-white inversion area is identified. For example, this overlapping state indicates that the area where the black-and-white inversion area in both the horizontal and vertical directions overlaps is one area (either the horizontal direction or the vertical direction).
If the value obtained by dividing the area of the black-and-white inversion area in the direction is equal to or greater than a predetermined threshold, the area surrounded by the black-and-white inversion area in both the horizontal and vertical directions is defined as the black-and-white inversion area. With this configuration, the black-and-white inversion area can be accurately identified, and the above-described problems (a) to (c) can be solved.

【0017】尚、白黒反転領域の識別は上記例に限ら
ず、水平方向と垂直方向の白黒反転候補領域の重なり合
う和を求め、当該和が所定値以上である時水平、垂直両
方向の白黒反転候補領域で囲まれた領域を白黒反転領域
とするようにしてもよく、その他各種方式が考えられ
る。
The discrimination of the black-and-white inversion area is not limited to the above example. The overlapping sum of the black-and-white reversal candidate areas in the horizontal and vertical directions is obtained, and when the sum is equal to or more than a predetermined value, the black-and-white inversion candidate in both the horizontal and vertical directions is obtained. A region surrounded by the region may be set as a black-and-white inversion region, and other various methods are conceivable.

【0018】請求項3の記載は、請求項1又は2記載の
発明を具体的にするものであり、例えば前記第1の統合
手段で統合した領域の線幅が所定の閾値以下であると判
断するとき、前記第1の統合手段で統合した領域を罫線
であると判断する罫線判断手段を有する構成である。
A third aspect of the present invention embodies the invention of the first or second aspect. For example, it is determined that the line width of the area integrated by the first integration means is equal to or smaller than a predetermined threshold. In this case, a ruled line judging means for judging the area integrated by the first integrating means to be a ruled line.

【0019】すなわち、罫線は比較的細い線幅であり、
上記第1の統合手段で統合した領域の線幅を所定の閾値
以上であると判断した時は上記のように白黒反転候補領
域と考えるが、所定の閾値以下であると判断する時には
当該領域を罫線であると判断する。
That is, the ruled line has a relatively narrow line width,
When it is determined that the line width of the area integrated by the first integration means is equal to or greater than a predetermined threshold, the area is considered as a black-and-white inversion candidate area as described above. Judge as a ruled line.

【0020】このように構成することにより、本例によ
れば白黒反転領域の識別と同時に、罫線の抽出も行うこ
とができ、極めて効率の良い白黒反転領域識別装置とす
ることができる。
With this configuration, according to the present embodiment, the ruled line can be extracted simultaneously with the identification of the black-and-white inversion area, and an extremely efficient black-and-white inversion area identification device can be provided.

【0021】請求項4の記載は、請求項3の記載を更に
具体的にするものであり、例えば前記罫線判断手段で判
断した罫線をそれぞれのマスク走査方向に統合して罫線
を作成する罫線作成手段を有する構成である。
According to a fourth aspect of the present invention, the ruled line is created by integrating the ruled lines determined by the ruled line determining means in respective mask scanning directions to form a ruled line. It is a configuration having means.

【0022】このように構成することにより、帳票等の
表形式の画像データを認識処理する際、白黒反転領域
(白黒反転セル)の識別と共に罫線を認識でき、白黒反
転領域の識別処理が終了する時、同時に例えば帳票フォ
ームの罫線作成も終了することになり、極めて効率の良
い白黒反転領域識別装置とすることができる。
With this configuration, when recognizing the tabular image data such as a form, the ruled line can be recognized together with the identification of the black-and-white inverted area (black-and-white inverted cell), and the identification processing of the black-and-white inverted area is completed. At the same time, for example, the creation of ruled lines on the form is also completed, and a highly efficient black-and-white inversion area identification device can be obtained.

【0023】請求項5の記載は、上記請求項4の記載を
更に具体的にするものであり、前記罫線作成手段が垂直
方向の罫線を作成する場合、例えば前記線分セグメント
列作成手段で作成した水平方向の線分セグメント列と、
前記垂直方向の罫線間で囲まれた領域を白黒反転領域と
する構成である。
A fifth aspect of the present invention further embodies the fourth aspect of the present invention. In the case where the ruled line creating means creates a vertical ruled line, for example, the line segment segment creating means creates the ruled line. Horizontal line segment column
An area surrounded by the vertical ruled lines is a black-and-white inversion area.

【0024】上記線分セグメント列は水平方向の白黒反
転候補領域の輪郭であり、例えば水平方向に長い白黒反
転候補領域と垂直方向の罫線で囲まれた領域を白黒反転
領域とする構成である。このように本例は、線分セグメ
ント列(白黒反転候補領域)と罫線で囲まれた領域を白
黒反転領域と識別するものである。
The line segment segment row is the outline of the horizontal black-and-white inversion candidate area. For example, the area surrounded by the horizontally long black-and-white inversion candidate area and the vertical ruled line is set as the black-and-white inversion area. As described above, in this example, the area surrounded by the line segment segment sequence (black and white inversion candidate area) and the ruled line is identified as a black and white inversion area.

【0025】また、請求項6の記載は、上記請求項4記
載の発明を具体的にするものであり、前記罫線設定手段
が水平方向の罫線を設定する場合、例えば前記線分セグ
メント列作成手段で作成した垂直方向の線分セグメント
列と、前記水平方向の罫線間で囲まれた領域を白黒反転
領域とする構成である。
Further, the sixth aspect of the present invention embodies the invention of the fourth aspect. When the ruled line setting means sets a horizontal ruled line, for example, the line segment segment string generating means The area surrounded by the vertical line segment segments created in step (1) and the horizontal ruled lines is a black-and-white inversion area.

【0026】本例の記載は、上記請求項5の記載とは逆
に、線分セグメント列は垂直方向の白黒反転候補領域の
輪郭であり、この線分セグメント列と水平方向の罫線で
囲まれた領域を白黒反転領域と識別するものである。
In the description of the present embodiment, the line segment segments are the outlines of the vertical black-and-white inversion candidate regions, and are surrounded by the line segment segments and the horizontal ruled lines. The discriminated area is identified as a black-and-white inversion area.

【0027】請求項7の記載は、上記請求項1又は5又
は6の記載を具体的にするものであり、前記白黒反転領
域の輪郭の凹凸を吸収するマージンが、前記線分セグメ
ント列に付加されている構成である。
A seventh aspect of the present invention embodies the first or fifth or sixth aspect of the present invention, wherein a margin for absorbing irregularities in the outline of the black-and-white inversion area is added to the line segment row. Configuration.

【0028】すなわち、本例は上記線分抽出マスクを用
いて線分抽出処理を行うと、個々に抽出された領域は、
例えば上下方向又は左右方向に凹凸を有し、本例はこの
凹凸を例えば白黒反転領域の外側方向(線分の法線ベク
トルの外側方向)に所定数のドットを追加し、白黒反転
領域の輪郭の凹凸を吸収する構成である。
That is, in this example, when the line segment extraction processing is performed using the line segment extraction mask, the individually extracted regions are
For example, in this example, a predetermined number of dots are added in the vertical direction or the horizontal direction, for example, in the direction outside the black-and-white inversion area (outside of the normal vector of the line segment), and the contour of the black-and-white inversion area is added. It is a configuration that absorbs irregularities.

【0029】請求項8の記載は、上記請求項1又は2記
載の発明を具体的にするものであり、前記白黒反転領域
設定手段は、例えば連結成分数が所定の閾値以下である
場合、水平方向の線分セグメント列と垂直方向の線分セ
グメント列で囲まれた領域を白黒反転領域に決定する構
成である。
An eighth aspect of the present invention embodies the invention of the first or second aspect, wherein the black-and-white inversion area setting means sets a horizontal level when the number of connected components is equal to or less than a predetermined threshold value. In this configuration, a region surrounded by the direction line segment segment row and the vertical direction line segment segment row is determined as a black-and-white inversion area.

【0030】したがって、本例の場合請求項1記載の発
明により白黒反転領域が識別されても、当該白黒反転領
域内の連結成分数が所定の閾値以下でなければ白黒反転
領域と決定しない構成である。ここで、連結成分数は白
黒反転候補領域の領域内に黒印字部又は白印字部の接続
した部分がいくつあるかを示すものであり、例えば白黒
反転候補領域内に網点等の多数の黒ドットが含まれてい
る場合、上記連結成分数を限定することにより網点等の
影響をなくすものである。
Therefore, in the present embodiment, even if the black-and-white inversion area is identified by the first aspect of the present invention, the black-and-white inversion area is not determined unless the number of connected components in the black-and-white inversion area is less than a predetermined threshold value. is there. Here, the number of connected components indicates the number of connected portions of the black printing portion or the white printing portion in the region of the black-and-white inversion candidate region. When a dot is included, the influence of a halftone dot or the like is eliminated by limiting the number of the connected components.

【0031】請求項9の記載は、上記請求項8の記載を
より具体的にするものであり、前記連結成分数を算出す
る例えば算出手段と、該算出手段で算出した連結成分数
が所定の閾値以下であることを識別する識別手段とを有
する構成である。
The ninth aspect of the present invention is a more specific example of the eighth aspect, wherein, for example, a calculating means for calculating the number of connected components, and the number of connected components calculated by the calculating means is a predetermined number. Identification means for identifying that the value is equal to or smaller than the threshold value.

【0032】ここで、上記算出手段による連結成分数の
算出は、例えば白黒反転領域内の独立する黒印字部を算
出する演算であり、また例えば網点等を有する場合、当
該黒ドット数を演算する構成である。一方、識別手段は
上記算出手段が算出した連結成分数が予め設定された閾
値以下であるか識別する手段であり、例えば網点等の模
様が白黒反転領域に付加されている場合、この識別手段
によって識別され、このような模様が付加されたセルと
白黒反転セルとを確実に識別するものである。
Here, the calculation of the number of connected components by the calculation means is, for example, an operation of calculating an independent black printing portion in a black-and-white inversion area. It is a configuration to do. On the other hand, the discriminating means is a means for discriminating whether the number of connected components calculated by the calculating means is equal to or less than a predetermined threshold value. Thus, the cell to which such a pattern is added and the black-and-white inverted cell are reliably identified.

【0033】請求項10の記載は、上記請求項4記載の
発明をより具体的にするものであり、前記領域抽出手段
は孤立した罫線候補を抽出し、該孤立した罫線候補の周
辺に前記白黒反転候補領域が存在する時、前記孤立した
罫線候補も白黒反転候補領域に統合する孤立罫線統合手
段を有する構成である。
According to a tenth aspect of the present invention, the region extracting means extracts an isolated ruled line candidate, and the area extracting means extracts the black and white around the isolated ruled line candidate. When there is an inversion candidate area, an isolated ruled line integrating means for integrating the isolated ruled line candidate into a black and white inversion candidate area is provided.

【0034】すなわち、黒画素密度の高い領域をマスク
走査方向に直交する方向で統合した結果、その領域の線
幅が所定の閾値以上であれば白黒反転候補領域として抽
出する。しかし、当該罫線候補の周辺に前記白黒反転候
補領域が存在する時、本来白黒反転候補領域であるが、
例えば“かすれ”等により孤立した罫線候補として誤っ
て抽出される場合もある。したがって、このような場合
を救済するため、孤立罫線統合手段によって白黒反転候
補領域に統合する。
That is, as a result of integrating a region having a high black pixel density in a direction orthogonal to the mask scanning direction, if the line width of the region is equal to or greater than a predetermined threshold, the region is extracted as a black-and-white inversion candidate region. However, when the black-and-white inversion candidate area exists around the ruled line candidate, it is originally a black-and-white inversion candidate area,
For example, a ruled line candidate may be erroneously extracted as an isolated ruled line candidate due to “blurring” or the like. Therefore, in order to remedy such a case, it is integrated into the black-and-white inversion candidate area by the isolated ruled line integrating means.

【0035】このように構成することにより、白黒反転
領域内に“かすれ”等の薄い黒印字があったとしても確
実にこれを検出し、補正処理して白黒反転領域として識
別することができる。
With this configuration, even if there is a faint black print such as "fading" in the black-and-white inversion area, it can be reliably detected, corrected, and identified as a black-and-white inversion area.

【0036】請求項11の記載は、上記請求項10の記
載をより具体的にするものであり、前記孤立した罫線候
補の抽出は、文字領域と罫線領域を区別する手段を備
え、罫線抽出処理後に白黒反転領域を抽出する構成であ
る。
The eleventh aspect of the present invention makes the above-described tenth aspect more concrete. The extraction of the isolated ruled line candidate includes means for distinguishing a character region from a ruled line region, and a ruled line extracting process. In this configuration, a black-and-white inversion area is extracted later.

【0037】すなわち、罫線抽出により抽出される罫線
には、本来の罫線以外に文字列等が誤って罫線と認識さ
れる場合があり、かかる場合文字領域と罫線領域を区別
することにより、確実に罫線を抽出するものである。
That is, the ruled line extracted by the ruled line extraction may have a character string or the like erroneously recognized as a ruled line in addition to the original ruled line. This is for extracting ruled lines.

【0038】請求項12の記載は、上記請求項1記載の
発明をより具体的にするものであり、前記線分セグメン
ト列には、該線分セグメント列が白黒反転領域であるこ
とを示す属性が付加されている構成である。
The twelfth aspect of the present invention makes the invention of the first aspect more concrete, wherein the line segment segment row has an attribute indicating that the line segment row is a black-and-white inversion area. Is added.

【0039】上記線分セグメント列への属性の付加は、
例えば線分セグメント列を記憶するメモリに専用のフラ
グを立て、白黒反転領域を示すセグメント列であること
を記憶させることで実現する。
The addition of the attribute to the line segment segment sequence is as follows.
For example, this is realized by setting a dedicated flag in a memory storing the line segment sequence and storing the segment sequence indicating the black-and-white inversion area.

【0040】請求項13の記載は、上記請求項12の記
載をより具体的にするものであり、前記線分セグメント
列には、白黒反転領域に対する前記線分セグメント列の
位置が、上下又は左右の辺の位置情報として付加されて
いる構成である。
According to a thirteenth aspect of the present invention, the position of the line segment segment with respect to the black-and-white inversion area is vertically or horizontally shifted. Is added as position information of the side of.

【0041】例えば、水平方向に2本の線分セグメント
列の場合、線分セグメント列には白黒反転領域に対する
位置によって、上又は下の位置情報が付加される。ま
た、垂直方向に2本の線分セグメント列の場合、白黒反
転領域に対する位置によって、右又は左の位置情報が付
加される。
For example, in the case of two line segment segments in the horizontal direction, upper or lower position information is added to the line segment segment depending on the position with respect to the black-and-white inversion area. In the case of two line segment segments in the vertical direction, right or left position information is added depending on the position with respect to the black-and-white inversion area.

【0042】このように構成することにより、作成され
た線分セグメント列の白黒反転領域に対する位置が明確
になり、例えば白黒反転領域と通常のセル領域を区別す
る際、容易に行うことができる。
With this configuration, the position of the created line segment line with respect to the black-and-white inversion area becomes clear, and, for example, when the black-and-white inversion area is distinguished from the normal cell area, it can be easily performed.

【0043】請求項14の記載は、上記請求項13の記
載をより具体的にするものであり、表のセル構造を解析
する際、該セルの位置情報が、前記線分セグメント列に
付加された上下又は左右の辺の位置情報と同じ場合には
白黒反転領域と判断し、異なる場合には通常のセル領域
と判断する構成である。
The description of claim 14 makes the description of claim 13 more concrete. When analyzing the cell structure of the table, the position information of the cell is added to the line segment sequence. If the position information is the same as the position information of the upper and lower or left and right sides, it is determined that the region is a black-and-white inversion region.

【0044】本例は上記請求項13の具体的適応例であ
り、上記構成により白黒反転領域と通常のセル領域の区
別を簡単に行うことができる。尚、線分セグメント列に
付加された上下、左右の位置情報は、上記以外に、例え
ば表に含まれる白黒反転領域の数や白黒反転領域のサイ
ズの算出等にも使用できる。
This embodiment is a specific application example of the thirteenth aspect, and the above configuration makes it possible to easily distinguish between a black-and-white inversion area and a normal cell area. In addition to the above, the vertical and horizontal position information added to the line segment segment row can be used, for example, for calculating the number of black-and-white inversion areas and the size of black-and-white inversion areas included in the table.

【0045】請求項15の記載は、上記請求項1又は2
記載の発明をより具体的にするものであり、前記白黒反
転領域内が複数のセル領域より成る場合、前記白黒反転
領域に接続する罫線を延長して白黒反転領域内の前記セ
ル領域を抽出する構成である。
[0045] Claim 15 is based on claim 1 or 2 above.
In a case where the black-and-white inversion area includes a plurality of cell areas, a ruled line connected to the black-and-white inversion area is extended to extract the cell area in the black-and-white inversion area. Configuration.

【0046】例えば、白黒反転領域が水平方向に形成さ
れている場合、垂直方向の罫線を上記白黒反転領域内に
延長し、白黒反転領域を例えば短冊状に分割して垂直方
向の罫線によって仕切られた領域をセル領域とするもの
である。
For example, when the black-and-white inversion area is formed in the horizontal direction, the vertical ruled line is extended into the black-and-white inversion area, and the black-and-white inversion area is divided into, for example, strips and separated by the vertical ruled line. The region that has been set is a cell region.

【0047】このように構成することにより、容易に白
黒反転領域をセル分割することができる。請求項16の
記載は、上記請求項15の記載をより具体的にするもの
であり、前記白黒反転領域内のセルを分割する際、白黒
反転領域に接続する罫線を延長した領域を細分割して黒
画素密度を求める手段を有する構成である。
With this configuration, the black-and-white inversion area can be easily divided into cells. According to a sixteenth aspect of the present invention, when the cells in the black-and-white inversion area are divided, an area obtained by extending a ruled line connected to the black-and-white inversion area is subdivided. And a means for determining a black pixel density.

【0048】すなわち、上記請求項15の記載により白
黒反転領域内をセル分割する場合、例えば垂直方向の罫
線を上記白黒反転領域内に延長し、白黒反転領域を短冊
状に分割する際、罫線を延長した白黒反転領域の位置に
白黒反転文字が存在する場合、この位置を罫線で仕切る
ことができないので、白黒反転文字の存在を確認するた
めに行う処理である。
That is, when dividing the black-and-white inversion area into cells as described in claim 15, for example, when the vertical ruled line is extended into the black-and-white inversion area and the black-and-white inversion area is divided into strips, the ruled line is divided into strips. If there is a black-and-white inverted character at the position of the extended black-and-white inverted area, this position cannot be separated by ruled lines, so this processing is performed to confirm the presence of the black-and-white inverted character.

【0049】したがって、例えば垂直方向に長い線分抽
出マスクを使用し、対象となる白黒反転領域内を線分抽
出マスクで黒画素数の抽出処理を行い、黒画素数が少な
い場合、すなわち白画素数が多い場合、当該位置には白
黒反転文字(白抜き文字)が存在し、セル分割できない
位置であることが分かる。
Therefore, for example, a line segment extraction mask that is long in the vertical direction is used, and the number of black pixels is extracted in the target black-and-white inversion area using the line segment extraction mask. If the number is large, it can be seen that there is a black-and-white inverted character (white character) at the position, and the position cannot be divided into cells.

【0050】このように構成することにより、白黒反転
領域内を正確にセル分割することができる。請求項17
記載の発明は上記課題を解決するため、表形式の2値イ
メージデータに対し、水平方向に長い線分抽出マスクを
用いて水平方向に走査し、垂直方向に長い線分抽出マス
クを用いて垂直方向に走査し、黒画素密度が所定の閾値
より高い領域をそれぞれ抽出する領域抽出手段と、該領
域抽出手段で抽出した前記黒画素密度の高い領域をそれ
ぞれのマスク走査方向に直交する方向で統合する第1の
統合手段と、該第1の統合手段で統合した領域の線幅が
所定の閾値以上であれば白黒反転候補領域であるとし、
該白黒反転候補領域をそれぞれのマスク走査方向に統合
する第2の統合手段と、該第2の統合手段で統合した白
黒反転候補領域の輪郭に対し、水平方向及び垂直方向の
線分セグメント列を作成する線分セグメント列作成手段
と、該線分セグメント列作成手段で作成した水平方向の
線分セグメント列と垂直方向の線分セグメント列で囲ま
れた領域を白黒反転領域に設定する第2の設定手段とを
備えた白黒反転領域識別部と、該白黒反転領域認識部に
より識別された白黒反転領域に対し、白黒反転処理を行
う白黒反転処理手段と、該白黒反転処理手段によって反
転処理された領域に位置する文字列に対して認識処理を
施す認識手段とを有する表認識装置を提供することによ
り達成できる。
With such a configuration, the inside of the black-and-white inversion area can be accurately divided into cells. Claim 17
In order to solve the above problems, the described invention scans binary image data in table format in the horizontal direction using a line segment extraction mask that is long in the horizontal direction, and vertically scans the binary image data using the line segment extraction mask that is long in the vertical direction. Region extracting means for scanning in the direction, and extracting regions in which the black pixel density is higher than a predetermined threshold, and integrating the high black pixel density regions extracted by the region extracting means in directions orthogonal to the respective mask scanning directions. If the line width of the area integrated by the first integrating means is equal to or greater than a predetermined threshold, the area is determined to be a black-and-white inversion candidate area;
Second integrating means for integrating the black-and-white inversion candidate areas in the respective mask scanning directions; and horizontal and vertical line segment segments for the outline of the black-and-white inversion candidate areas integrated by the second integration means. A line segment segment sequence creating means to be created, and a second region for setting an area surrounded by the horizontal line segment segment sequence and the vertical line segment segment sequence created by the line segment segment sequence creating means as a black-and-white inversion area. A black-and-white inversion area identifying unit having setting means; a black-and-white inversion processing unit for performing black-and-white inversion processing on the black-and-white inversion area identified by the black-and-white inversion area recognition unit; This can be achieved by providing a table recognizing device having a recognizing means for performing a recognizing process on a character string located in an area.

【0051】本発明は、前記請求項1記載の白黒反転領
域識別装置を使用した表認識装置である。すなわち、水
平方向に長い線分抽出マスクと垂直方向に長い線分抽出
マスクを使用し、黒画素密度が所定の閾値より高い領域
をそれぞれ抽出し、この黒画素密度の高い領域に対し、
マスク走査方向に直交する方向で統合し、更にマスク走
査方向に統合し、例えば白黒反転候補領域の輪郭に対の
線分セグメント列を形成し、その線分セグメント列に囲
まれた領域を白黒反転領域に設定した、当該領域に対
し、白黒反転処理手段によって白黒反転処理を施すもの
であり、更に白黒反転処理手段によって反転処理された
領域に位置する文字列に対して認識処理を行う認識手段
とを有する表認識装置である。
The present invention is a table recognizing apparatus using the black-and-white inversion area discriminating apparatus according to claim 1. In other words, using a line segment extraction mask that is long in the horizontal direction and a line segment extraction mask that is long in the vertical direction, regions where the black pixel density is higher than a predetermined threshold are respectively extracted, and for the region where the black pixel density is high,
Integrate in the direction orthogonal to the mask scanning direction, and further integrate in the mask scanning direction.For example, a pair of line segment segments is formed on the contour of the black and white reversal candidate area, and the area surrounded by the line segment row is black and white reversed. A recognizing means for performing black-and-white reversal processing by the black-and-white reversal processing means on the area set in the area, and further performing recognition processing on a character string positioned in the area reversed by the black-and-white reversal processing means; Is a table recognition device having

【0052】このように構成することにより、正確に識
別された白黒反転領域に対し白黒反転処理を行い、白黒
反転領域内の文字列に対し文字認識処理を施す表認識装
置を提供できる。この場合、白黒反転処理が施された文
字列は正確に黒印字されるので確実な表認識処理を行う
ことができる。
With this configuration, it is possible to provide a table recognizing device that performs black-and-white inversion processing on a correctly identified black-and-white inversion area and performs character recognition processing on a character string in the black-and-white inversion area. In this case, the character string that has been subjected to the black-and-white inversion processing is accurately printed in black, so that a reliable table recognition processing can be performed.

【0053】請求項18記載の発明は上記課題を解決す
るため、表形式の2値イメージデータに対し、水平方向
に長い線分抽出マスクを用いて水平方向に走査し、垂直
方向に長い線分抽出マスクを用いて垂直方向に走査し、
黒画素密度が所定の閾値より高い領域をそれぞれ抽出す
る領域抽出手段と、該領域抽出手段で抽出した前記黒画
素密度の高い領域をそれぞれのマスク走査方向に直交す
る方向で統合する第1の統合手段と、該第1の統合手段
で統合した領域の線幅が所定の閾値以上であれば白黒反
転候補領域であるとし、該白黒反転候補領域をそれぞれ
のマスク走査方向に統合する第2の統合手段と、該第2
の統合手段で統合した水平方向の白黒反転候補領域と垂
直方向の白黒反転候補領域の重なり状態により白黒反転
領域を設定する白黒反転領域設定手段とを備えた白黒反
転領域識別部と、該白黒反転領域認識部により識別され
た白黒反転領域に対し、白黒反転処理を行う白黒反転処
理手段と、該白黒反転処理手段によって反転処理された
領域に位置する文字列に対して認識処理を施す認識手段
とを有する表認識装置を提供することにより達成でき
る。
According to an eighteenth aspect of the present invention, in order to solve the above problem, binary image data in a table format is scanned in the horizontal direction using a line segment extraction mask that is long in the horizontal direction, and the line segment that is long in the vertical direction is scanned. Scan vertically using the extraction mask,
A region extracting means for extracting regions having black pixel densities higher than a predetermined threshold value, and a first integration for integrating the regions having high black pixel densities extracted by the region extracting means in directions orthogonal to the respective mask scanning directions. Means and a second integration for integrating the black-and-white inversion candidate area in the respective mask scanning directions if the line width of the area integrated by the first integration means is equal to or greater than a predetermined threshold value Means and the second
A black-and-white inversion area identification unit including black-and-white inversion area setting means for setting a black-and-white inversion area based on the overlapping state of the horizontal and black-and-white inversion candidate areas integrated by the integration means; Black-and-white inversion processing means for performing black-and-white inversion processing on the black-and-white inversion area identified by the area recognition unit; and recognition means for performing recognition processing on a character string located in the area inverted by the black-and-white inversion processing means. This can be achieved by providing a table recognition device having

【0054】本発明は、前記請求項2記載の白黒反転領
域識別装置を使用した表認識装置であり、上記請求項1
7記載の表認識装置に対し、第2の統合手段で統合した
水平方向の白黒反転候補領域と垂直方向の白黒反転候補
領域の重なり状態により白黒反転領域を設定する白黒反
転領域識別装置を使用する表認識装置である。
According to the present invention, there is provided a table recognizing apparatus using the black-and-white inversion area discriminating apparatus according to claim 2.
7. A black-and-white inversion area identification device that sets a black-and-white inversion area based on the overlapping state of the horizontal and black-and-white inversion candidate areas integrated by the second integration means with respect to the table recognition apparatus described in 7 above. It is a table recognition device.

【0055】このように構成することにより、正確に識
別された白黒反転領域に対し白黒反転処理を行い、白黒
反転領域内の文字列に対し文字認識処理を施す表認識装
置を提供できる。この場合、白黒反転処理が施された文
字列は正確に黒印字されるので確実な認識処理を行うこ
とができる。
With this configuration, it is possible to provide a table recognizing apparatus that performs black-and-white inversion processing on a correctly identified black-and-white inversion area and performs character recognition processing on a character string in the black-and-white inversion area. In this case, the character string that has been subjected to the black-and-white inversion processing is accurately printed in black, so that it is possible to perform a reliable recognition processing.

【0056】請求項19の記載は、上記請求項17記載
の発明を具体的にするものであり、前記白黒反転処理手
段は、前記白黒反転領域の輪郭セグメントを塗りつぶす
塗りつぶし手段と、前記輪郭セグメント列以外の白黒反
転領域を白黒反転する処理手段を具備する構成である。
The nineteenth aspect of the present invention embodies the invention according to the seventeenth aspect, wherein the black-and-white inversion processing means includes a painting-out means for painting out an outline segment of the black-and-white inversion area, and the outline segment row. It is configured to include processing means for performing black-and-white inversion on a black-and-white inversion area other than the above.

【0057】すなわち、本例は塗りつぶし手段によって
白黒反転領域の輪郭部分を、例えば黒色で塗りつぶして
枠取りし、その中の白黒反転領域を処理手段によって反
転処理する構成である。
That is, in this embodiment, the outline portion of the black-and-white inversion area is painted out with, for example, black by the painting means and framed, and the black-and-white inversion area therein is subjected to inversion processing by the processing means.

【0058】請求項20の記載は、上記請求項19の記
載を具体的にするものであり、前記白黒反転処理手段
は、セルによって分割された領域を塗りつぶすセル領域
塗りつぶし手段を有する構成である。
A twentieth aspect of the present invention embodies the specifics of the nineteenth aspect, wherein the black-and-white inversion processing means has a cell area painting means for painting an area divided by cells.

【0059】この場合も、上記白黒反転領内のセル分割
される分割線を、例えば黒色で塗りつぶし、白黒反転領
域を反転処理した際にセル分割線が分かるようにする構
成である。
Also in this case, the dividing line for dividing the cells in the black-and-white inversion area is painted in black, for example, so that the cell dividing line can be recognized when the black-and-white inversion area is inverted.

【0060】請求項21の記載は、上記請求項17又は
18記載の発明を具体的にするものであり、前記白黒反
転処理手段によって反転処理された白黒反転領域に位置
する文字列の線幅を算出し、該算出した線幅に従って前
記文字列を膨張又は収縮処理し、前記文字列を整形する
構成である。
According to a twenty-first aspect of the present invention, the line width of a character string positioned in a black-and-white inversion area, which has been inverted by the black-and-white inversion processing means, is specified. The character string is expanded or reduced according to the calculated line width, and the character string is shaped.

【0061】このように構成することにより、白黒反転
処理により起こり得る文字列の線幅の異常を修正し、正
確な文字列に整形するものである。請求項22の記載
は、上記請求項17又は18記載の発明を具体的にする
ものであり、前記白黒反転領域設定手段は、連結成分数
が所定の閾値以下である場合、白黒反転領域の設定処理
を行う構成である。
With such a configuration, an abnormality in the line width of a character string that can occur due to the black-and-white inversion processing is corrected, and the character string is shaped into an accurate character string. The invention of claim 22 embodies the invention of claim 17 or 18, wherein the monochrome inversion area setting means sets the monochrome inversion area when the number of connected components is equal to or less than a predetermined threshold. This is a configuration for performing processing.

【0062】本例は上記請求項8の記載に対応する構成
であり、当該構成を表認識装置に適用するものである。
すなわち、白黒反転領域の設定に際し連結成分数を計算
し、該連結成分数が所定の閾値以内である時白黒反転領
の決定を行うことにより確実に白黒反転領域セルを識別
でき、白黒反転領域に対して正確に反転処理を施した状
態で文字認識等の認識処理を行える表認識装置を提供で
きる。
This embodiment has a configuration corresponding to the above-described claim 8, and the configuration is applied to a table recognition device.
That is, when setting the black-and-white inversion area, the number of connected components is calculated, and when the number of connected components is within a predetermined threshold value, the black-and-white inversion area cell can be reliably identified by determining the black-and-white inversion area. On the other hand, it is possible to provide a table recognizing device that can perform a recognition process such as character recognition in a state where the reversal process has been accurately performed.

【0063】請求項23の記載は、上記請求項17又は
18記載の発明を具体的にするものであり、前記領域抽
出手段は孤立した罫線候補を抽出し、該孤立した罫線候
補の周辺に前記白黒反転候補領域が存在する時、前記孤
立した罫線候補も白黒反転候補領域に統合する孤立罫線
統合手段を有する構成である。
The invention according to claim 23 embodies the invention according to claim 17 or 18, wherein the area extracting means extracts an isolated ruled line candidate and places the isolated ruled line candidate around the isolated ruled line candidate. When a black-and-white inversion candidate area is present, an isolated ruled line integrating means is also provided for integrating the isolated ruled line candidate into the black-and-white inversion candidate area.

【0064】本例は上記請求項10の記載に対応する構
成であり、当該構成を表認識装置に適用するものであ
る。すなわち、黒画素密度の高い領域をマスク走査方向
に直交する方向で統合した結果、その領域の線幅が所定
の閾値以下であれば罫線候補として抽出し、当該罫線候
補の周辺に前記白黒反転候補領域が存在する時、白黒反
転候補領域とする。このように構成することにより、例
えば“かすれ”により孤立した罫線候補と判断された場
合でも、孤立罫線統合手段によって白黒反転候補領域に
統合され、白黒反転領域の正確な領域に対して反転処理
を施した状態で文字認識等の認識処理を行える表認識装
置を提供できる。
This embodiment has a configuration corresponding to the above-mentioned claim 10 and is applicable to a table recognition device. That is, as a result of integrating a region having a high black pixel density in a direction orthogonal to the mask scanning direction, if the line width of the region is equal to or less than a predetermined threshold, the region is extracted as a ruled line candidate, and the black-and-white inversion candidate is surrounded around the ruled line candidate. When an area exists, it is set as a black-and-white inversion candidate area. With this configuration, even if it is determined that the ruled line is an isolated ruled line candidate due to, for example, "blurring," the isolated ruled line integrating means integrates it into the black-and-white inversion candidate region, and performs the inversion process on the accurate black-and-white inverted region. It is possible to provide a table recognizing device that can perform a recognition process such as character recognition in a state where the recognition is performed.

【0065】請求項24の記載は、上記請求項17記載
の発明を具体的にするものであり、前記線分セグメント
列には、例えば該線分セグメント列が白黒反転領域であ
ることを示す属性が付加されている構成である。
According to a twenty-fourth aspect of the present invention, the line segment segment sequence includes, for example, an attribute indicating that the line segment segment sequence is a black-and-white inversion area. Is added.

【0066】本例は上記請求項12の記載に対応する構
成であり、当該構成を表認識装置に適用するものであ
る。すなわち、線分セグメント列は白黒反転領域に対応
するものであり、当該線分セグメント列に白黒反転領域
に対する位置の属性として、上下又は左右等の属性を付
加することにより、線分セグメント列の位置が明確とな
り、白黒反転セルと通常セルとの区別も簡単になり、表
認識処理を容易とする表認識装置が提供できる。
This embodiment has a configuration corresponding to the above-mentioned claim 12 and is applicable to a table recognition device. That is, the line segment line corresponds to the black-and-white inversion area, and the position of the line segment line is added by adding an attribute such as up / down or left / right as a position attribute to the black-and-white inversion region to the line segment line. Is clear, the distinction between the black-and-white inverted cell and the normal cell is simplified, and a table recognition device that facilitates the table recognition processing can be provided.

【0067】請求項25の記載は、上記請求項17又は
18記載の発明を具体的にするものであり、前記白黒反
転領域内が、例えば複数のセル領域より成る場合、前記
白黒反転領域に接続する罫線を延長して白黒反転領域内
の前記セル領域を抽出する構成である。
A twenty-fifth aspect of the present invention embodies the invention according to the seventeenth or eighteenth aspect. When the black-and-white inversion area includes, for example, a plurality of cell areas, a connection to the black-and-white inversion area is made. The cell area in the black-and-white inversion area is extracted by extending the ruled line to be used.

【0068】本例は上記請求項15の記載に対応する構
成であり、当該構成を表認識装置に適用するものであ
る。すなわち、白黒反転領域内に複数のセル領域が存在
する場合、当該白黒反転領域に対しその延長線が短冊状
に接続する罫線を利用し、白黒反転領域を複数のセルに
分割する構成である。
This embodiment has a configuration corresponding to the above-described claim 15 and is applicable to a table recognition device. That is, when there are a plurality of cell areas in the black-and-white inversion area, the black-and-white inversion area is divided into a plurality of cells by using a ruled line whose extension is connected in a strip shape to the black-and-white inversion area.

【0069】このように構成することにより、1つの白
黒反転領域内に複数のセル領域が存在する場合でも、確
実にセル領域を分割することができ、正確に分割された
セル領域に対して認識処理を行うことができる表認識装
置を提供する。
With this configuration, even when a plurality of cell areas exist in one black-and-white inversion area, the cell area can be surely divided, and the correctly divided cell area can be recognized. A table recognition device capable of performing processing is provided.

【0070】請求項26の記載は、上記請求項25記載
の発明を具体的にするものであり、前記白黒反転領域内
のセルを分割する際、例えば白黒反転領域に接続する罫
線を延長した領域を細分割して黒画素密度を求める手段
を有する構成である。
The invention according to claim 26 embodies the invention according to claim 25, wherein, when dividing the cells in the black-and-white inversion area, for example, an area in which a ruled line connected to the black-and-white inversion area is extended Is subdivided to obtain a black pixel density.

【0071】本例は白黒反転領域内をセル分割する際の
1つの方式を説明するものであり、この方式によれば白
黒反転領域内の文字列を誤ってセル分割することがない
表認識装置を提供できる。尚、白黒反転領域内をセル分
割する方式は上記例に限るものではない。
This example describes one method for dividing a cell in a black-and-white inversion area. According to this method, a table recognizing device that prevents a character string in a black-and-white inversion area from being erroneously divided into cells. Can be provided. The method of dividing the inside of the black-and-white inversion area into cells is not limited to the above example.

【0072】請求項27記載の発明は上記課題を解決す
るため、表形式の2値イメージデータに対し、水平方向
に長い線分抽出マスクを用いて水平方向に走査し、垂直
方向に長い線分抽出マスクを用いて垂直方向に走査し、
黒画素密度が所定の閾値より高い領域をそれぞれ抽出す
る機能と、該機能で抽出した前記黒画素密度の高い領域
をそれぞれのマスク走査方向に直交する方向で統合する
機能と、該機能で統合した領域の線幅が所定の閾値以上
であれば白黒反転候補領域であるとし、該白黒反転候補
領域をそれぞれのマスク走査方向に統合する機能と、該
機能で統合した白黒反転候補領域の輪郭に対し、水平方
向及び垂直方向の線分セグメント列を作成する機能と、
該機能で作成された水平方向の線分セグメント列と垂直
方向の線分セグメント列で囲まれた領域を白黒反転領域
に設定する機能とをコンピュータに実行させる命令を含
むプログラムを格納した前記コンピュータが読み取り可
能な記憶媒体を提供することにより達成できる。
According to a twenty-seventh aspect of the present invention, in order to solve the above-mentioned problem, the binary image data in the table format is scanned in the horizontal direction using a line segment extraction mask that is long in the horizontal direction, and the line segment that is long in the vertical direction is scanned. Scan vertically using the extraction mask,
A function of extracting regions in which the black pixel density is higher than a predetermined threshold value, a function of integrating the regions in which the black pixel density is high extracted by the function in a direction orthogonal to the respective mask scanning directions, and a function of integrating the functions. If the line width of the area is equal to or more than a predetermined threshold, it is determined that the area is a black-and-white inversion candidate area, and the function of integrating the black-and-white inversion candidate area in each mask scanning direction and the outline of the black-and-white inversion candidate area integrated by this function The ability to create horizontal and vertical line segment segments,
The computer storing a program including an instruction for causing the computer to execute a function of setting a region surrounded by the horizontal line segment segments and the vertical line segment segments created by the function as a black-and-white inversion region is provided. This can be achieved by providing a readable storage medium.

【0073】本発明は上記処理を行うプログラムをハー
ドディスク、ICメモリカード、磁気テープ、フロッピ
ーディスク、又は光ディスクなどの記憶媒体に記憶する
構成であり、プログラムの実行の際、上記記憶媒体から
プログラムを読み出して実行する。
According to the present invention, a program for performing the above processing is stored in a storage medium such as a hard disk, an IC memory card, a magnetic tape, a floppy disk, or an optical disk. When the program is executed, the program is read from the storage medium. Run.

【0074】請求項28記載の発明は上記課題を解決す
るため、表形式の2値イメージデータに対し、水平方向
に長い線分抽出マスクを用いて水平方向に走査し、垂直
方向に長い線分抽出マスクを用いて垂直方向に走査し、
黒画素密度が所定の閾値より高い領域をそれぞれ抽出す
る機能と、該機能で抽出した前記黒画素密度の高い領域
をそれぞれのマスク走査方向に直交する方向で統合する
機能と、該機能で統合した領域の線幅が所定の閾値以上
であれば白黒反転候補領域であるとし、該白黒反転候補
領域をそれぞれのマスク走査方向に統合する機能と、該
機能で統合した水平方向の白黒反転候補領域と垂直方向
の白黒反転候補領域の重なり状態により白黒反転領域を
設定する機能とをコンピュータに実行させる命令を含む
プログラムを格納した前記コンピュータが読み取り可能
な記憶媒体を提供することにより達成できる。
According to a twenty-eighth aspect of the present invention, in order to solve the above-mentioned problem, the binary image data in the table format is scanned in the horizontal direction using a line segment extraction mask which is long in the horizontal direction, and the line segments which are long in the vertical direction are scanned. Scan vertically using the extraction mask,
A function of extracting regions in which the black pixel density is higher than a predetermined threshold value, a function of integrating the regions in which the black pixel density is high extracted by the function in a direction orthogonal to the respective mask scanning directions, and a function of integrating the functions. If the line width of the area is equal to or greater than a predetermined threshold, it is determined that the area is a black-and-white inversion candidate area, a function of integrating the black-and-white inversion candidate area in each mask scanning direction, and a horizontal black-and-white inversion candidate area integrated by the function. This can be achieved by providing a computer-readable storage medium storing a program including an instruction for causing a computer to execute a function of setting a black-and-white inversion area according to the overlapping state of the black-and-white inversion candidate areas in the vertical direction.

【0075】本発明も上記処理を行うプログラムをハー
ドディスク、ICメモリカード、磁気テープ、フロッピ
ーディスク、又は光ディスクなどの記憶媒体に記憶する
構成であり、プログラムの実行の際、上記記憶媒体から
プログラムを読み出して実行する。
The present invention also has a configuration in which a program for performing the above processing is stored in a storage medium such as a hard disk, an IC memory card, a magnetic tape, a floppy disk, or an optical disk. When the program is executed, the program is read from the storage medium. Run.

【0076】また、請求項29の記載は、請求項1又は
2記載の発明の白黒反転領域の意味を具体的に示すもの
であり、前記白黒反転領域の白黒には色の三要素によっ
て作成される任意の2色を含むものであり、例えば白と
赤、白と青、黄色と赤、黄色と緑、等各種組み合わせが
考えられる。
Further, claim 29 specifically shows the meaning of the black-and-white inversion area according to the invention of claim 1 or 2, and the black and white of the black-and-white inversion area is formed by three elements of color. For example, various combinations such as white and red, white and blue, yellow and red, and yellow and green are conceivable.

【0077】さらに、請求項30の記載も同様に、請求
項17又は18記載の発明の白黒反転領域の意味を具体
的に示すものであり、前記白黒反転領域の白黒には色の
三要素によって作成される任意の2色を含むものであ
り、白と赤、白と青、黄色と赤、黄色と緑、等各種組み
合わせが考えられる。
Further, the description of claim 30 similarly specifically indicates the meaning of the black-and-white inversion area of the invention according to claim 17 or 18, and the black and white of the black-and-white inversion area is represented by three elements of color. It includes any two colors to be created, and various combinations such as white and red, white and blue, yellow and red, yellow and green, and the like can be considered.

【0078】[0078]

【発明の実施の形態】以下、本発明の実施形態例を図面
を用いて詳細に説明する。図1は本実施形態例の白黒反
転領域認識装置を含む表認識装置のシステム構成図であ
る。本例は、例えば表計算ソフトや帳票フォーム等に使
用される表の中の白黒反転領域を抽出するため、m×n
の線分抽出マスクを用い、局所的に黒画素密度の高い領
域を求め、それらの統合により局所的に存在する白黒反
転領域の抽出を可能にするものである。
Embodiments of the present invention will be described below in detail with reference to the drawings. FIG. 1 is a system configuration diagram of a table recognition device including the black-and-white inversion area recognition device of the embodiment. This example uses m × n to extract a black-and-white inversion area in a table used for, for example, spreadsheet software or a form.
In this method, a region having a high black pixel density is locally obtained by using the line segment extraction mask described above, and a black-and-white inversion region existing locally can be extracted by integrating those regions.

【0079】同図において、1は様々な処理を行う中央
演算処理ユニット(CPU)、2は上記CPU1で実行
されるプログラムを格納するプログラムメモリ、3は画
像データをビットマップ形式で格納する画像メモリ、4
は画像処理に使用するワークメモリ、5は画像を光学的
に読み取るスキャナ、6はスキャナ5により読み取られ
た情報を一時的に格納するメモリ、7は各文字画像の特
徴を格納した辞書ファイル、8は認識結果を表示するデ
ィスプレイ、9は認識結果を印刷するプリンタ、10は
ディスプレイ8及びプリンタ9のインターフェイス回
路、11はCPU1、プログラムメモリ2、画像メモリ
3、ワークメモリ4、メモリ6、辞書ファイル7、イン
ターフェイス回路10及びドライバ12を接続している
バス、13はハードディスク、14はICメモリカー
ド、15は磁気テープ、16はフロッピーディスク、1
7はCD−ROMなどの光ディスクである。
In the figure, 1 is a central processing unit (CPU) for performing various processes, 2 is a program memory for storing programs executed by the CPU 1, and 3 is an image memory for storing image data in a bitmap format. , 4
Is a work memory used for image processing, 5 is a scanner for optically reading images, 6 is a memory for temporarily storing information read by the scanner 5, 7 is a dictionary file storing characteristics of each character image, 8 Is a display for displaying the recognition result, 9 is a printer for printing the recognition result, 10 is an interface circuit for the display 8 and the printer 9, 11 is a CPU 1, a program memory 2, an image memory 3, a work memory 4, a memory 6, and a dictionary file 7. , A bus connecting the interface circuit 10 and the driver 12, 13 a hard disk, 14 an IC memory card, 15 a magnetic tape, 16 a floppy disk, 1
Reference numeral 7 denotes an optical disk such as a CD-ROM.

【0080】本装置のシステムは、スキャナ5により読
み取った画像データをメモリ6に一時的に格納し、その
画像データをビットマップ形式で画像メモリ3に展開す
る。そして、画像メモリ3からワークメモリ4にコピー
された2値画像データに対してパターン抽出処理を行
う。その結果に基づいて、スキャナ5により読み取った
画像データから文字画像の切り出しを行い、切り出され
た文字画像の特徴と辞書ファイル7に格納された特徴デ
ータとの比較を行い、その認識結果をディスプレイ8又
はプリンタ9に出力する。
The system of the present apparatus temporarily stores the image data read by the scanner 5 in the memory 6 and develops the image data in the image memory 3 in a bitmap format. Then, a pattern extraction process is performed on the binary image data copied from the image memory 3 to the work memory 4. Based on the result, a character image is cut out from the image data read by the scanner 5, the feature of the cut out character image is compared with the feature data stored in the dictionary file 7, and the recognition result is displayed on the display 8. Or, it outputs to the printer 9.

【0081】このシステムにおいて、白黒反転領域の抽
出は、プログラムメモリ2に格納されたプログラムに従
って処理を行うCPU1の機能として実現される。ここ
で、白黒反転領域抽出処理を行うプログラムは、プログ
ラムメモリ2のROMに予め格納されている。また、白
黒反転領域抽出処理を行うプログラムを、ハードディス
ク13、ICメモリカード14、磁気テープ15、フロ
ッピーディスク16、又は光ディスク17などの記憶媒
体からプログラムメモリ2のRAMにロードしてから、
このプログラムをCPU1で実行させるようにしてもよ
い。
In this system, the extraction of the black-and-white inversion area is realized as a function of the CPU 1 which performs processing according to a program stored in the program memory 2. Here, the program for performing the black-and-white inversion area extraction processing is stored in the ROM of the program memory 2 in advance. Also, after loading the program for performing the black-and-white inversion area extraction processing from a storage medium such as the hard disk 13, the IC memory card 14, the magnetic tape 15, the floppy disk 16, or the optical disk 17 into the RAM of the program memory 2,
This program may be executed by the CPU 1.

【0082】さらに、白黒反転領域抽出処理を行うプロ
グラムを、通信インターフェイスを介して通信ネットワ
ークから取り出すこともできる。例えば、通信インター
フェイス19と接続される通信ネットワークとして、例
えば、LAN(LocalArea Networ
k)、WAN(Wide Area Networ
k)、インターネット、アナログ電話網、デジタル電話
網(ISDN:Integral Service D
igital Network)、PHS(パーソナル
ハンディシステム)や衛星通信などの無線通信網などを
用いることができる。
Further, a program for performing the black-and-white inversion area extraction processing can be extracted from the communication network via the communication interface. For example, as a communication network connected to the communication interface 19, for example, a LAN (Local Area Network)
k), WAN (Wide Area Network)
k), the Internet, an analog telephone network, a digital telephone network (ISDN: Integral Service D)
wireless network such as digital network, PHS (personal handy system), and satellite communication.

【0083】次に、図2に示す処理は、上述のようにプ
ログラムメモリ2に記憶されたプログラムに基づいて、
CPU1が行う認識処理である。同図において、CPU
1は、先ず画像入力20の処理を行い、前述のように画
像メモリ3に記憶した画像データ(イメージデータ)の
入力処理を行う。次に、線分抽出マスクを用いてイメー
ジデータを順次抽出する線分抽出21の処理を行う。例
えば、この線分抽出マスクは縦×横がm×nのドット抽
出マスクであり、線分を抽出するマスクであるので、水
平方向の線分を抽出する場合、水平方向に長い(例えば
1×6、1×30等)のマスクを使用し、垂直方向の線
分を抽出する場合、垂直方向に長い(例えば6×1、3
0×1等)のマスクを使用する。そして、上述のような
水平方向に長い線分抽出マスク、又は垂直方向に長い線
分抽出マスクを使用し、イメージデータを順次切り出
し、切り出したデータに含まれる黒画素数が一定のスレ
ッショルド値(閾値)以上である時、全て黒画素成分の
線分とする。
Next, the processing shown in FIG. 2 is based on the program stored in the program memory 2 as described above.
This is a recognition process performed by the CPU 1. In FIG.
1 performs the processing of the image input 20 first, and performs the input processing of the image data (image data) stored in the image memory 3 as described above. Next, a process of line segment extraction 21 for sequentially extracting image data using a line segment extraction mask is performed. For example, since this line segment extraction mask is a dot extraction mask with vertical and horizontal dimensions of m × n and is a mask for extracting line segments, when extracting a horizontal line segment, it is long in the horizontal direction (for example, 1 × n). When a vertical line segment is extracted using a mask of 6, 1 × 30, etc., it is long in the vertical direction (for example, 6 × 1, 3).
0 × 1). Then, the image data is sequentially cut out using the line segment extraction mask that is long in the horizontal direction or the line segment extraction mask that is long in the vertical direction, and the number of black pixels included in the cut out data is a fixed threshold value (threshold value). ) If it is greater than or equal to, it is all assumed to be a black pixel component line segment.

【0084】次に、白黒反転領域抽出22の処理を行
う。この処理は、上述の線分抽出21の処理で水平方向
に長い線分、又は垂直方向に長い線分を統合し、統合し
た領域が罫線であるか、又は白黒反転領域であるか判別
し、白黒反転領域を抽出する。この判別には所定の閾値
が使用され、所定の閾値以上の線幅を有する統合線分に
対し白黒反転領域の対象線分とする。
Next, the process of black-and-white inversion area extraction 22 is performed. This process integrates the horizontally long line segment or the vertically long line segment in the above-described line segment extraction 21 process, and determines whether the integrated region is a ruled line or a black-and-white inverted region. Extract the black and white reversal area. A predetermined threshold value is used for this determination, and an integrated line segment having a line width equal to or larger than the predetermined threshold value is set as a target line segment in the black-and-white inversion area.

【0085】次に、セル領域抽出23では、上記線分抽
出21の処理で抽出された線分の中で上記白黒反転領域
抽出22にもれた線分、すなわち統合線分の中で所定の
閾値以下の線幅の統合線分を罫線候補とし、セル領域の
抽出処理を行う。
Next, in the cell area extraction 23, a predetermined line segment among the line segments extracted in the line segment extraction process 21 and leaked to the black-and-white inversion area extraction 22, that is, the integrated line segment is extracted. An integrated line segment having a line width equal to or smaller than the threshold value is set as a ruled line candidate, and a cell region extraction process is performed.

【0086】次に、セル内項目抽出24の処理は、セル
領域抽出23の処理により抽出されたセル領域内の項
目、及び白黒反転領域抽出22の処理によって抽出され
た白黒反転領域に対し白黒反転処理を行い、反転処理後
の例えば文字列に対しセル内項目抽出処理を行う。
Next, the processing of the in-cell item extraction 24 is performed by inverting the black-and-white inversion of the items in the cell area extracted by the processing of the cell area extraction 23 and the black-and-white inversion area extracted by the processing of the black-and-white inversion area extraction 22. Then, an in-cell item extraction process is performed on, for example, the character string after the inversion process.

【0087】そして、最後にセル内の項目データに対
し、文字認識25の処理を行う。この処理は、例えば抽
出した項目内の文字(ビットマップデータ)に対し、予
め前述の辞書7に登録された文字の特徴データと比較す
ることにより、特徴の一致した文字データ、又は最も特
徴が近似する文字データを認識文字とする。
Finally, the character recognition 25 is performed on the item data in the cell. In this processing, for example, the character (bitmap data) in the extracted item is compared with the characteristic data of the character registered in the dictionary 7 in advance, so that the character data whose characteristics match or the characteristic is most approximated. The character data to be recognized is a recognition character.

【0088】図3は上述の処理を具体的に説明するシス
テム構成図である。尚、同図において、画像入力部30
は、上述の図2で説明した画像入力20の処理を行うも
のであり、線分抽出部32は同じく図2の線分抽出21
の処理を行うものである。また、同図に示す線分統合部
33、罫線抽出部34、白黒反転領域決定部35、白黒
反転領域内セル決定部36、画素反転部37は、図2の
白黒反転領域抽出22の処理に対応する各部である。
FIG. 3 is a system configuration diagram specifically explaining the above processing. Note that, in FIG.
Performs the processing of the image input 20 described with reference to FIG. 2 described above.
Is performed. Also, the line segment integration unit 33, ruled line extraction unit 34, black-and-white inversion area determination unit 35, black-and-white inversion area cell determination unit 36, and pixel inversion unit 37 shown in FIG. The corresponding parts.

【0089】尚、図3の画像領域格納部31は、図1の
ワークメモリ4のエリアの一部である。 <第1の実施形態例>以下、上述のシステム構成を使用
し、第1の実施形態例について説明する。
The image area storage section 31 shown in FIG. 3 is a part of the area of the work memory 4 shown in FIG. <First Embodiment> The first embodiment will be described below using the above system configuration.

【0090】先ず、図4に示すフローチャートは本例の
処理を説明するものである。以下、同図に従って説明す
る。尚、前述の画像メモリ3には既にスキャナ5から表
形式の例えば帳票の原稿が読み込まれ、バス11を介し
て対応するイメージデータが格納されているものとす
る。
First, the flowchart shown in FIG. 4 explains the processing of this embodiment. Hereinafter, description will be given with reference to FIG. It is assumed that the above-mentioned image memory 3 has already read, for example, a document in the form of a table from the scanner 5 and stores the corresponding image data via the bus 11.

【0091】先ず、CPU1は画像メモリ3に格納され
たイメージデータを読み出し、線分抽出22及び白黒反
転領域抽出23の各処理を行う。これらの処理は水平方
向、又は垂直方向に対して別々に行う。本例の説明で
は、図4に記載の左側の処理である水平方向処理から説
明する。
First, the CPU 1 reads out the image data stored in the image memory 3 and performs line segment extraction 22 and black-and-white inversion area extraction 23 processing. These processes are performed separately in the horizontal direction or the vertical direction. In the description of this example, the horizontal processing, which is the processing on the left side shown in FIG. 4, will be described.

【0092】先ず、水平方向の線分抽出処理(ステップ
(以下Sで示す)1)は、水平方向に長い線分抽出マス
クを用いて行う。この線分抽出マスクとしてはm×n
が、例えば1×6(尚、線分抽出マスクとしては1×6
のマスクに限らず、1×15、1×30等のマスクも使
用することができる)のマスクを使用する。
First, horizontal line segment extraction processing (step (hereinafter referred to as S) 1) is performed using a line segment extraction mask that is long in the horizontal direction. This line segment extraction mask is mxn
However, for example, 1 × 6 (the line extraction mask is 1 × 6
Not only the mask of (1), but also a mask of 1 × 15, 1 × 30, etc. can be used).

【0093】図5は上述の線分抽出処理(S1)を具体
的に説明するフローチャートである。この処理は同図に
示すように、先ず上述の線分抽出マスクで対応する1×
6の領域を切り取り、その中の黒画素数をマスクサイズ
で割り算した値(マスク内のパターン黒画素数/マスク
サイズ)が予め設定した閾値より大きいか判断する(S
1−1)。この結果、割り算した値が所定の閾値より大
きい時、線分抽出マスクで切り取られた線分(すなわ
ち、細く比較的短い線分)には黒画素数が多く、この場
合マスク内を全て線分とする(黒画素とする)(S1−
1がYES、S1−2)。一方、マスク内の黒画素数を
マスサイズで割り算した値が閾値より小さい時、線分抽
出マスクで切り取られた領域には黒画素数が少なく、切
り取った領域は線分ではないと判断する(S1−1がN
O)。
FIG. 5 is a flowchart specifically explaining the above-described line segment extraction processing (S1). In this process, as shown in the figure, first, the corresponding 1 ×
6 is determined, and it is determined whether a value obtained by dividing the number of black pixels in the area by the mask size (the number of pattern black pixels in the mask / mask size) is larger than a preset threshold (S).
1-1). As a result, when the divided value is larger than the predetermined threshold value, the number of black pixels is large in the line segment cut by the line segment extraction mask (that is, the thin and relatively short line segment). (Black pixel) (S1-
1 is YES, S1-2). On the other hand, when the value obtained by dividing the number of black pixels in the mask by the mass size is smaller than the threshold value, it is determined that the number of black pixels is small in the region cut by the line segment extraction mask, and the cut region is not a line segment ( S1-1 is N
O).

【0094】図6は上述の処理を具体的に説明する図で
あり、例えば、m×n(縦×横)が1×6の画素(ドッ
ト)の領域を指定する線分抽出マスクにより、水平方向
成分を抽出する場合を説明するものである。同図(a)
は互いに重なり合ったマスク領域「1」〜「9」を示
し、同図(b)のイメージデータに対し、上記線分抽出
マスクを用いてマスク処理を行うことにより、水平方向
の線分が抽出されることを示す。この処理により、多数
の極めて細く短い領域(m×nが1×6の線分)が、水
平方向及び垂直方向に抽出される。
FIG. 6 is a diagram specifically explaining the above-described processing. For example, a horizontal line extraction mask that specifies an area of pixels (dots) whose m × n (vertical × horizontal) is 1 × 6 is used. This is to explain a case where a directional component is extracted. FIG.
Indicates mask areas "1" to "9" overlapping each other, and a horizontal line segment is extracted by performing mask processing on the image data of FIG. Indicates that Through this processing, a large number of extremely thin and short regions (m × n is 1 × 6 line segments) are extracted in the horizontal and vertical directions.

【0095】次に、図4に示す線分統合処理(S2)を
実行する。この線分統合処理の具体例は、上述の図5に
示す判断(S2−1)と統合処理(S2−2)であり、
また上記統合処理の際、図4に示す白黒反転領域候補抽
出処理(S3)も同時に実行される(尚、上述の白黒反
転領域候補抽出処理(S3)の具体的な処理は図7のフ
ローチャートに従って行われる)。また、線分統合処理
は、図3に示した線分統合部33が行う処理である。す
なわち、前述の図4の処理(S1)に従って、抽出され
た線分に対し上下の線分、又は左右の線分が接している
か判断し(S2−1)、接している線分があれば(S2
−1がYES)、これらを統合し(S2−2)、矩形領
域を作成する(S2−3)。
Next, a line segment integration process (S2) shown in FIG. 4 is executed. Specific examples of the line segment integration processing are the determination (S2-1) and the integration processing (S2-2) shown in FIG.
In addition, at the time of the integration processing, the black-and-white inversion area candidate extraction processing (S3) shown in FIG. 4 is also executed at the same time. Done). The line integration process is a process performed by the line integration unit 33 shown in FIG. That is, according to the above-described processing (S1) of FIG. 4, it is determined whether the upper and lower line segments or the left and right line segments are in contact with the extracted line segment (S2-1). (S2
-1 is YES), these are integrated (S2-2), and a rectangular area is created (S2-3).

【0096】ここで、線分統合部33は第1の統合手段
としての機能、及び第2の統合手段としての機能を有
し、先ず始めには第1の統合手段としての機能として、
上記線分の上下方向(垂直方向)を統合する。すなわ
ち、上述のように線分抽出マスクを用いて水平方向に領
域(線分)を切り取った場合、その領域と直交する方向
(垂直方向)の他の領域(線分)を統合する。この場
合、統合領域(線分)間の距離が所定のスレッショルド
値(thd)より短くなければならず(S3−1)、上
記スレッショルド値(thd)より線分間の距離が長い
場合、接すると判断しない。この場合、線分間の距離が
離れすぎているため、同じ線分とは見なせないためであ
る。また、この統合は線分間の長さが同じ場合に行われ
(S3−2)、長さが違う場合には部分的な統合を行う
(S3−3)。
Here, the line integrating unit 33 has a function as a first integrating unit and a function as a second integrating unit. First, as a function as the first integrating unit,
The vertical direction (vertical direction) of the line segments is integrated. That is, when a region (line segment) is cut out in the horizontal direction using the line segment extraction mask as described above, another region (line segment) perpendicular to the region (vertical direction) is integrated. In this case, the distance between the integrated regions (line segments) must be shorter than a predetermined threshold value (thd) (S3-1), and if the distance between the line segments is longer than the threshold value (thd), it is determined that they touch. do not do. In this case, because the distance between the line segments is too large, they cannot be regarded as the same line segment. This integration is performed when the lengths of the line segments are the same (S3-2), and when the lengths are different, partial integration is performed (S3-3).

【0097】以上の処理により水平方向に1×6の領域
(線分)は、当該領域に黒画素数が所定の閾値以上あれ
ば垂直方向に延びてゆき、上述の処理によって統合した
領域(線分)の幅が所定の閾値を越えれば白黒反転候補
領域とする。そして、白黒反転領域と判断された場合、
次に統合線分をマスク走査方向に統合する。
By the above processing, the 1 × 6 region (line segment) in the horizontal direction extends in the vertical direction if the number of black pixels is equal to or more than a predetermined threshold value, and the region (line) integrated by the above processing is obtained. If the width of (minute) exceeds a predetermined threshold, it is determined as a black-and-white inversion candidate area. If it is determined that the area is the black-and-white inversion area,
Next, the integrated line segments are integrated in the mask scanning direction.

【0098】この処理が線分統合部33の第2の機能で
ある。この統合処理は、マスク走査方向に隣り合う白黒
反転候補領域を順次統合するものである。そして、この
ようにして白黒反転候補領域がマスク走査方向に延びて
ゆき、上述の矩形領域が形成される(S2−3)。
This process is the second function of the line segment integration unit 33. This integration process sequentially integrates the black-and-white inversion candidate regions adjacent in the mask scanning direction. Then, the black-and-white inversion candidate area extends in the mask scanning direction in this way, and the above-described rectangular area is formed (S2-3).

【0099】図8及び図9は上述の線分統合処理の結果
を示す図である。尚、図8は統合領域内に“かすれ”等
がない場合を示し、図9は統合領域内に“かすれ”等が
ある場合を示す。
FIG. 8 and FIG. 9 are diagrams showing the results of the above-described line segment integration processing. FIG. 8 shows a case where there is no “blurring” or the like in the integrated area, and FIG. 9 shows a case where there is “blurring” or the like in the integrated area.

【0100】先ず、図8の例について説明すると、同図
に示す、は線幅がスレッショルド値以上(閾値以
上)の領域を統合した線分である。すなわち、水平方向
に長いm×nの線分抽出マスクを使用し、垂直方向、及
び水平方向に統合した結果得られた線幅がスレッショル
ド値(同図に示すスレッショルド値(thd1))以上
の線分であり、白黒反転候補領域である。尚、水平方向
に長いm×nの線分抽出マスクの大きさを、例えばMと
すると同図に示す大きさの関係が白黒反転候補領域との
間にある。
First, the example of FIG. 8 will be described. FIG. 8 shows a line segment obtained by integrating regions having a line width equal to or more than a threshold value (not less than a threshold value). That is, the line width obtained as a result of integrating in the vertical and horizontal directions using an mxn line segment extraction mask that is long in the horizontal direction is equal to or larger than the threshold value (threshold value (thd1) shown in the figure). Min, which is a black and white reversal candidate area. If the size of the mxn line segment extraction mask that is long in the horizontal direction is M, for example, the size relationship shown in FIG.

【0101】一方、図9は、上述のように統合領域内に
“かすれ”部分を含む例であり、同図に示す’、
”、は線幅がスレッショルド値以上(同図に示すス
レッショルド値(thd1))の領域を統合した線分で
ある。これらの線分も白黒反転候補領域の線分である
が、図9の’−”の線分は、図8の線分に比較し
て“かすれ”部分に対応する部分が削られた状態であ
る。この理由は、前述の統合処理の際垂直方向への統合
線分距離が足りず、垂直方向への統合処理が厚く行われ
ず(S3−1が(>thd))、細い統合線分となった
ものである。
On the other hand, FIG. 9 is an example in which the integrated area includes a "blurred" portion as described above.
"" Is a line segment obtained by integrating regions having a line width equal to or larger than the threshold value (threshold value (thd1) shown in FIG. 9). These line segments are also line segments of the black-and-white inversion candidate region. The line segment of "-" is a state in which the portion corresponding to the "blurred" portion is cut away as compared with the line segment of FIG. The reason for this is that in the above-described integration processing, the integration line segment distance in the vertical direction was insufficient, and the integration processing in the vertical direction was not performed thickly (S3-1 (> thd)), resulting in a thin integrated line segment. Things.

【0102】次に、図4に示す罫線候補抽出処理(S
4)を行う。この処理は前述の図3に示す罫線抽出部3
4が行う処理である。この処理を具体的に説明する図が
図10に示すフローチャートである。先ず、前述の処理
により統合された統合線分の中で白黒反転候補領域に含
まれない統合線分を抽出する(S4−1)。次に上記抽
出処理により抽出された統合線分に対し、当該統合線分
の線幅が所定のスレッショルド値(thd1)より狭い
か判断する(S4−2)。ここで、当該統合線分の線幅
が所定のスレッショルド値(thd1)より狭い時、罫
線候補とする(S4−2)。
Next, ruled line candidate extraction processing (S
Perform 4). This processing is performed by the ruled line extracting unit 3 shown in FIG.
4 is the process performed. FIG. 10 is a flowchart specifically illustrating this processing. First, an integrated line segment not included in the black-and-white inversion candidate area is extracted from the integrated line segments integrated by the above-described processing (S4-1). Next, it is determined whether the line width of the integrated line segment extracted by the extraction processing is smaller than a predetermined threshold value (thd1) (S4-2). Here, when the line width of the integrated line segment is narrower than a predetermined threshold value (thd1), it is determined as a ruled line candidate (S4-2).

【0103】ここで、前述の図8、図9を用いて説明す
ると、スレッショルド値(thd1)が両図に示す幅の
時、統合線分の、’、、’は罫線候補となる。
また、図9の場合、統合線分、’、”、、’
が罫線候補となる。図8と図9を比べて異なる部分は罫
線候補に”が“かすれ”のある図9に存在することで
ある。尚、図4の罫線抽出処理(S5)は、上述の罫線
候補抽出処理によって抽出された罫線候補をマスク走査
方向に統合し、水平方向に長い線分を作成するものであ
る。
Here, with reference to FIGS. 8 and 9 described above, when the threshold value (thd1) is the width shown in both figures, the integrated line segments “,” are ruled line candidates.
Also, in the case of FIG. 9, the integrated line segment, ', ",'
Is a ruled line candidate. 8 is different from FIG. 9 in that the ruled line candidate is present in FIG. 9 with “blurred.” The ruled line extraction process (S5) in FIG. The extracted ruled line candidates are integrated in the mask scanning direction to create a line segment long in the horizontal direction.

【0104】次に、図4の孤立罫線抽出処理(S6)を
行う。この処理を具体的に説明する図が図11のフロー
チャートである。この処理は、上述の罫線候補抽出処理
により抽出された罫線に対し、左右、又は上下に距離の
スレッショルド値(thd2)以内に白黒反転候補領域
が存在するか判断するものである(S6−1)。前述の
図8の例の場合、統合線分、’、、’は上述の
孤立罫線にあたらない。すなわち、統合線分の、に
は線分の右側に白黒反転候補領域又はが存在する
が、線分の左側には白黒反転候補領域が存在しないから
である。また、統合線分の’、’には線分の左側に
白黒反転候補領域、が存在するが、線分の右側には
白黒反転候補領域が存在しないからである。
Next, the isolated ruled line extraction processing (S6) of FIG. 4 is performed. FIG. 11 is a flowchart specifically illustrating this processing. In this process, it is determined whether or not there is a black-and-white inversion candidate region within the threshold value (thd2) of the distance left and right or up and down with respect to the ruled line extracted by the above-described ruled line candidate extraction process (S6-1). . In the case of the example of FIG. 8 described above, the integrated line segment, ',' does not correspond to the above-mentioned isolated ruled line. That is, although the black-and-white inversion candidate area or the right side of the integrated line segment exists on the right side of the line segment, the black-and-white inversion candidate area does not exist on the left side of the line segment. In addition, the black and white inversion candidate area exists on the left side of the integrated line segment ',', but the black and white inversion candidate area does not exist on the right side of the line segment.

【0105】一方、図9の例の場合、統合線分、
’、、’については上述の図8の例と同じである
が、統合線分”の場合異なる。すなわち、統合線分
”の左右には白黒反転候補領域’、”が存在する
(S6−1がYES)。したがって、統合線分”は孤
立罫線として抽出される。
On the other hand, in the case of the example of FIG.
8 are the same as in the example of FIG. 8 described above, but are different in the case of the integrated line segment ". That is, the black and white reversal candidate regions", "exist on the left and right of the integrated line segment" (S6-1). Therefore, the integrated line segment "" is extracted as an isolated ruled line.

【0106】次に、図4の孤立罫線と白黒反転候補領域
の統合処理(S7)を行う。この処理は図3に示す白黒
反転領域決定部35が行う処理である。この処理を具体
的に説明する図が図12のフローチャートである。この
処理は、上述の処理(S6)によって抽出した孤立罫線
を囲む上下、又は左右の白黒反転候補領域に外接する矩
形領域の算出を行うものである(S7−1)。すなわ
ち、上述のように孤立罫線は、例えば図9の”の統合
線分であり、その左右には白黒反転領域’と”が位
置する。したがって、同図の”に示すような孤立罫線
を両側の白黒反転領域’、”に統合する処理を行
う。具体的には図9に□印で囲うの矩形領域を算出す
る。
Next, the integration process (S7) of the isolated ruled line and the black-and-white inversion candidate region in FIG. 4 is performed. This process is a process performed by the black and white reversal area determination unit 35 shown in FIG. FIG. 12 is a flowchart specifically illustrating this processing. This processing is to calculate a rectangular area circumscribing the upper and lower, or left and right, black and white reversal candidate areas surrounding the isolated ruled line extracted in the above processing (S6) (S7-1). That is, as described above, the isolated ruled line is, for example, the integrated line segment of "" in FIG. Accordingly, processing is performed to integrate an isolated ruled line as shown by "" in FIG. Specifically, a rectangular area enclosed by a square in FIG. 9 is calculated.

【0107】以上の説明に従って水平方向に対する白黒
反転領域の抽出、及び罫線領域の抽出処理が完了する。
また、以上の処理は、水平方向に対する白黒反転領域、
及び罫線領域の抽出処理であるが、垂直方向に対しても
同様に行う。
The extraction of the black-and-white inversion area in the horizontal direction and the extraction processing of the ruled line area are completed according to the above description.
In addition, the above processing is performed in a black-and-white inversion area in the horizontal direction,
And the extraction process of the ruled line area, but the same is performed in the vertical direction.

【0108】すなわち、図4に示すフローチャートの右
側の処理であり、垂直方向に長い線分抽出マスクを用い
て垂直方向の線分抽出処理(ステップ(以下S’で示
す)1)を行い、抽出した線分に対して線分統合処理を
行う(S2’)。この具体的な処理は、前述と同様、図
5及び図7のフローチャートに従って行われる。次に、
白黒反転候補領域抽出処理(S3’)を行い、白黒反転
候補領域を抽出し、罫線候補抽出処理(S4’)を行
い、罫線抽出を行う(S5’)。さらに孤立罫線に対す
る抽出処理を行い(S6’)、最後に垂直方向に対する
白黒反転候補領域の統合処理(S7’)を行う。尚、上
述の各処理共、水平方向の場合と同様、図10〜図12
の具体的なフローチャートに従って実行される。
That is, this is the processing on the right side of the flow chart shown in FIG. 4, in which the vertical line segment extraction processing (step (hereinafter referred to as S ') 1) is performed by using the vertical long line segment extraction mask and extracted. A line segment integration process is performed on the line segment thus obtained (S2 '). This specific processing is performed in accordance with the flowcharts of FIGS. 5 and 7 as described above. next,
A black-and-white inversion candidate area extraction process (S3 ') is performed to extract a black-and-white inversion candidate area, a ruled line candidate extraction process (S4'), and a ruled line extraction (S5 '). Further, extraction processing is performed on the isolated ruled line (S6 ′), and finally, integration processing of the black-and-white reversal candidate area in the vertical direction is performed (S7 ′). In each of the above-described processes, as in the case of the horizontal direction, FIGS.
Is executed in accordance with the specific flowchart of FIG.

【0109】以上の処理により、垂直方向に対する白黒
反転領域、及び罫線領域の抽出処理も終了し、次に水平
/垂直の白黒反転候補領域の統合処理に移行する(図4
のS8)。
With the above-described processing, the processing of extracting the black-and-white inversion area and the ruled line area in the vertical direction is also completed, and then the processing shifts to the integration processing of horizontal / vertical black-and-white inversion candidate areas (FIG. 4).
S8).

【0110】図13はこの処理を具体的に説明するフロ
ーチャートである。また、図14は図13のフローチャ
ートに沿ってその処理を説明する図である。先ず、図1
3のフローチャートに従って、水平方向の白黒反転候補
領域を抽出する(S8−1)。この白黒反転候補領域は
図14の’、”、及びである。次に、水平方向の
白黒反転領域に重なる垂直方向の白黒反転領域の抽出を
行う(S8−2)。この白黒反転候補領域は図14に示
す、である。尚、この垂直方向の白黒反転候補領域
は、図4の白黒反転領域抽出処理(S3’)において抽
出された領域である。
FIG. 13 is a flowchart specifically explaining this processing. FIG. 14 is a view for explaining the processing in accordance with the flowchart of FIG. First, FIG.
According to the flowchart of 3, a black-and-white inversion candidate area in the horizontal direction is extracted (S8-1). The black-and-white inversion candidate areas are ', ", and in Fig. 14. Next, a vertical black-and-white inversion area overlapping with the horizontal black-and-white inversion area is extracted (S8-2). This is shown in Fig. 14. Note that the black-and-white inversion candidate area in the vertical direction is an area extracted in the black-and-white inversion area extraction processing (S3 ') in Fig. 4.

【0111】次に、水平方向の白黒反転候補領域と垂直
方向の白黒反転候補領域の重なっている部分の面積を算
出する(S8−3)。すなわち、図14の水平方向の白
黒反転候補領域’と垂直方向の白黒反転候補領域が
重なった領域A、白黒反転候補領域”と垂直方向の白
黒反転候補領域が重なった領域B、水平方向の白黒反
転候補領域と垂直方向の白黒反転候補領域が重なっ
た領域C、白黒反転候補領域と垂直方向の白黒反転候
補領域が重なった領域Dの各面積を計算し、上記A、
B、C、Dの面積を加算する。
Next, the area of the overlapping portion between the horizontal black-and-white inversion candidate area and the vertical black-and-white inversion candidate area is calculated (S8-3). That is, the area A in which the horizontal black-and-white inversion candidate area ′ and the vertical black-and-white inversion candidate area in FIG. 14 overlap, the area B in which the black-and-white inversion candidate area overlaps with the vertical black-and-white inversion candidate area, the horizontal black-and-white The respective areas of the area C where the inversion candidate area and the vertical black-and-white inversion candidate area overlap each other and the area D where the black-and-white inversion candidate area and the vertical black-and-white inversion candidate area overlap each other are calculated.
The areas of B, C, and D are added.

【0112】次に、上述の処理によって算出した重なっ
た領域の面積を利用し、以下の計算を行う。すなわち、
(重なっている部分の面積)/水平方向の白黒反転領域
の面積を計算し、この値とスレッショルド値(thd
3)を比較する(S8−4)。そして、(重なっている
部分の面積)/水平方向の白黒反転領域の面積がスレッ
ショルド値(thd3)より大きい時(≧thd3)、
水平方向の白黒反転候補領域と垂直方向の白黒反転候補
領域が外接する矩形領域を算出する(S8−6)。すな
わち、この場合、水平方向の白黒反転候補領域と垂直方
向の白黒反転領域の(重なっている部分の面積)が大き
い場合であり、白黒反転領域であると識別してもよい場
合である。一方、上述の判断(S8−4)において、
(重なっている部分の面積)/水平方向の白黒反転領域
の面積がスレッショルド値(thd3)より小さい時
(<thd3)、水平方向の白黒反転候補領域と垂直方
向の白黒反転領域の(重なっている部分の面積)が小さ
く、白黒反転領域であると識別できない場合である。
Next, the following calculation is performed using the area of the overlapped region calculated by the above processing. That is,
(Area of overlapping portion) / Area of black-and-white inversion area in horizontal direction is calculated, and this value and threshold value (thd
3) is compared (S8-4). When the area of the (overlapping portion) / the area of the black-and-white inversion region in the horizontal direction is larger than the threshold value (thd3) (≧ thd3),
A rectangular area where the horizontal black / white inversion candidate area and the vertical black / white inversion candidate area are circumscribed is calculated (S8-6). That is, in this case, the horizontal black-and-white inversion candidate area and the vertical black-and-white inversion area have a large (overlapping area) and may be a black-and-white inversion area. On the other hand, in the above determination (S8-4),
When the area of the (overlapping portion) / the area of the horizontal black-and-white inversion area is smaller than the threshold value (thd3) (<thd3), the horizontal black-and-white inversion candidate area and the vertical black-and-white inversion area overlap. This is a case where the area cannot be identified as a black-and-white inversion area.

【0113】但し、この場合更に次の判断(S8−5)
を実行する。すなわち、上述とは逆に(重なっている部
分の面積)/垂直方向の白黒反転領域の面積を計算し、
この値とスレッショルド値(thd3)を比較する。そ
して、(重なっている部分の面積)/垂直方向の白黒反
転領域の面積がスレッショルド値(thd3)より大き
い時(≧thd3)、垂直方向に対する(重なっている
部分の面積)の比は大きいものであるとして、白黒反転
候補領域と垂直方向の白黒反転候補領域を外接する矩形
領域を算出する(S8−6)。すなわち、この場合、水
平方向の白黒反転候補領域と垂直方向の白黒反転領域の
(重なっている部分の面積)は、垂直方向の白黒反転候
補領域の面積に対しては充分大きいものであり、白黒反
転領域であると識別してもよいと判断できるからであ
る。
However, in this case, the next judgment (S8-5)
Execute That is, contrary to the above, the area of the black-and-white inversion area in the vertical direction (the area of the overlapping part) / the vertical direction is calculated,
This value is compared with a threshold value (thd3). When the area of (overlapping portion) / the area of the black-and-white inversion region in the vertical direction is larger than the threshold value (thd3) (≧ thd3), the ratio of (overlapping portion area) to the vertical direction is large. Assuming that there is, a rectangular area circumscribing the black-and-white inversion candidate area and the vertical black-and-white inversion candidate area is calculated (S8-6). That is, in this case, the area of the horizontal black-and-white inversion candidate area and the vertical black-and-white inversion area (the area of the overlapping portion) is sufficiently large with respect to the area of the vertical black-and-white inversion candidate area. This is because it can be determined that the area may be identified as a reverse area.

【0114】以上の処理により、水平方向の白黒反転候
補領域と垂直方向の白黒反転候補領域が外接する矩形領
域を算出すると、図14の□印で囲った実線領域Eとな
る。すなわち、この領域が水平方向及び垂直方向の白黒
反転候補領域から識別した白黒反転領域である。
When the rectangular region where the horizontal black-and-white inversion candidate region and the vertical black-and-white inversion candidate region are circumscribed by the above processing is calculated, a solid line region E surrounded by a square in FIG. 14 is obtained. That is, this area is a black-and-white inversion area identified from the horizontal and vertical black-and-white inversion candidate areas.

【0115】但し、本例では上記水平/垂直の白黒反転
候補領域の統合処理で得られた結果から直ちに白黒反転
領域を決定するのではなく、次の白黒反転領域内の連結
成分の算出処理(図4のS9)を実行し、この結果に基
づき白黒反転領域の決定処理を行う(図4のS10)。
以下、具体的に説明する。
However, in the present embodiment, the black-and-white inversion area is not immediately determined from the result obtained in the integration processing of the horizontal / vertical black-and-white inversion candidate areas, but the process of calculating the connected component in the next black-and-white inversion area (see FIG. Step S9 in FIG. 4 is executed, and a process of determining a black-and-white inversion area is performed based on the result (S10 in FIG. 4).
Hereinafter, a specific description will be given.

【0116】先ず、連結成分の算出は図15に示すフロ
ーチャートに従って実行され、例えば白黒反転領域内を
ラベリングして連結成分数を算出する(S9−1)。す
なわち、連結成分数の算出は、例えば白黒反転領域内の
独立する黒印字部にラベルを付し、そのラベル数(連結
成分数)を算出する処理である。したがって、例えば白
黒反転領域内に網点等が有る場合、当該黒ドット数(ラ
ベル数、連結成分数)は極めて大きな値となる。
First, the calculation of the connected components is executed according to the flowchart shown in FIG. 15. For example, the number of connected components is calculated by labeling the inside of the black-and-white inversion area (S9-1). That is, the calculation of the number of connected components is, for example, a process of attaching a label to an independent black print portion in a black-and-white inversion area and calculating the number of labels (number of connected components). Therefore, for example, when there is a halftone dot or the like in the black-and-white inversion area, the number of black dots (the number of labels and the number of connected components) has an extremely large value.

【0117】次に、白黒反転領域の決定処理を行う(S
10)。この決定処理は図16に示す処理によって行わ
れ、上述の連結成分が所定のスレッショルド値(thd
4)以上であれば白黒反転候補領域を棄却し、連結成分
が所定のスレッショルド値以下であれば白黒反転候補領
域を白黒反転領域として決定する(S10−1)。
Next, a process of determining a black-and-white inversion area is performed (S
10). This determination process is performed by the process shown in FIG. 16, and the above-described connected component is converted to a predetermined threshold value (thd
4) If it is equal to or more than the threshold value, the black-and-white inversion candidate area is rejected, and if the connected component is equal to or smaller than a predetermined threshold value, the black-and-white inversion candidate area is determined as the black-and-white inversion area (S10-1).

【0118】すなわち、前述のように算出した連結成分
数が予め設定された閾値以下であるか識別する処理であ
り、例えば網点等の模様が白黒反転領域に付加されてい
る場合、この処理によって識別され、このような模様が
付加されたセルは本来の白黒反転領域(白黒反転セル)
と確実に識別され、白黒反転領域から排除される。
That is, this is a process for identifying whether or not the number of connected components calculated as described above is equal to or less than a preset threshold value. For example, when a pattern such as a halftone dot is added to the black-and-white inversion area, this process is performed. The cells identified and provided with such a pattern are the original black-and-white inverted areas (black-and-white inverted cells)
And is excluded from the black-and-white inversion area.

【0119】ここで、例えば図17に示す例の場合、黒
印字部は背景の黒部1個と、文字列「会社名」に含まれ
る独立の黒印字部(例えば6個)の合計7個である。し
たがって、この場合連結成分数のスレッショルド値(t
hd4)を「10」とすれば判断(S10−1)は(≦
thd4)であり、この場合白黒反転領域である。
Here, for example, in the case of the example shown in FIG. 17, the black printing portion is a total of seven black printing portions (for example, six) included in the character string "company name" and one black portion in the background. is there. Therefore, in this case, the threshold value (t
hd4) is “10”, the judgment (S10-1) is (≦
thd4), in this case, a black-and-white inversion area.

【0120】次に、上述の処理により決定した白黒反転
領域の輪郭セグメント表現を行う(S11)。この処理
は具体的には図18のフローチャートに従って処理され
る。すなわち、白黒反転領域の外郭に位置する抽出済み
線分に着目し、線分の線幅を白黒反転領域の外側方向
(線分の放線ベクトルの外側方向)に増分する(S11
−1)。そして、線分の矩形の頂点座標を格納する(S
11−2)。
Next, a contour segment expression of the black-and-white inversion area determined by the above processing is performed (S11). This process is specifically performed according to the flowchart of FIG. In other words, paying attention to the extracted line segment located on the outer periphery of the black-and-white inversion area, the line width of the line segment is incremented in the direction outside the black-and-white inversion area (outside the radiation vector of the line segment) (S11).
-1). Then, the vertex coordinates of the rectangle of the line segment are stored (S
11-2).

【0121】具体的には図19に示すように、水平方向
と垂直方向の線分抽出マスクによって抽出される領域
(線分)は、元々の画像の傾き等により最大4度程度傾
く場合があり、抽出する領域(線分)も上下、左右にず
れて抽出される。このため、上述のように線分の線幅を
白黒反転領域の外側方向に増分する補正を行う。
More specifically, as shown in FIG. 19, the region (line segment) extracted by the horizontal and vertical line segment extraction masks may be inclined up to about 4 degrees due to the inclination of the original image. , The region (line segment) to be extracted is also shifted vertically and horizontally. Therefore, as described above, correction is performed to increase the line width of the line segment in the outward direction of the black-and-white inversion area.

【0122】次に、白黒反転領域の属性付与処理を行う
(S12)。この処理は、具体的には図20に示すフロ
ーチャートの如く、上述の処理で作成した輪郭セグメン
トの白黒反転領域における位置情報を属性データとして
格納する(S12−1)。例えば、上述の図19の線分
セグメント列の例で説明すると、白黒反転領域の上側に
位置する線分セグメント列a1〜a4には白黒反転領域
の「上」の位置を示す属性が付加され、線分セグメント
列b1、b2には白黒反転領域の「右」の位置を示す属
性が付加され、白黒反転領域の下側に位置する線分セグ
メント列c1〜c4には白黒反転領域の「下」の位置を
示す属性が付加され、線分セグメント列d1、d2には
白黒反転領域の「左」の位置を示す属性が付加される。
Next, an attribute assigning process for the black-and-white inversion area is performed (S12). In this process, specifically, as shown in the flowchart of FIG. 20, the position information of the contour segment created in the above process in the black-and-white inversion area is stored as attribute data (S12-1). For example, in the above-described example of the line segment segments shown in FIG. 19, the line segment segments a1 to a4 located above the black-and-white inversion area are added with an attribute indicating the position “up” of the black-and-white inversion area. An attribute indicating the position of “right” in the black-and-white inversion area is added to the line segment segment rows b1 and b2, and the line segment segment rows c1 to c4 located below the black-and-white inversion area are “below” the black-and-white inversion area. Is added, and an attribute indicating the “left” position of the black-and-white inversion area is added to the line segment segment rows d1 and d2.

【0123】このように構成することにより、当該白黒
反転領域を囲う線分セグメント列には上記属性が付加さ
れ、例えばこれらの属性をワークメモリ4に線分セグメ
ント列の位置情報と共に格納しておくことにより、後に
表認識処理を行う際、当該線分セグメント(列)が白黒
反転領域を囲うセグメント(列)であり、しかもその属
性データから白黒反転領域のどの位置に対応するか容易
に判断できる。
With such a configuration, the above-described attributes are added to the line segment segments surrounding the black-and-white inversion area. For example, these attributes are stored in the work memory 4 together with the position information of the line segment segments. Thus, when the table recognition processing is performed later, the line segment (column) is a segment (column) surrounding the black-and-white inversion area, and it can be easily determined from the attribute data which position of the black-and-white inversion area corresponds. .

【0124】次に、白黒反転領域内のセル分割を行う
(図4のS13)。尚、この処理は図3に示す白黒反転
領域内セル決定部36が行う処理である。すなわち、白
黒反転領域内が複数のセルで構成されている場合もあ
り、上述のように設定した白黒反転領域内をセル分割す
る。
Next, cell division within the black-and-white inversion area is performed (S13 in FIG. 4). This process is performed by the black / white inversion area cell determining unit 36 shown in FIG. That is, the inside of the black-and-white inversion area may be composed of a plurality of cells, and the inside of the black-and-white inversion area set as described above is divided into cells.

【0125】この処理を具体的に説明するフローチャー
トが図21である。先ず、白黒反転領域に接する罫線で
輪郭セグメントから距離(スレッショルド値(thd
5))以上離れた罫線を抽出する(S13−1)。例え
ば、白黒反転領域が水平方向に形成されている場合、垂
直方向の罫線を抽出する。次に、罫線を白黒反転領域内
へ延長した短冊領域を抽出する(S13−2)。すなわ
ち、上述のように抽出した垂直方向の罫線を白黒反転領
域内に延長し、白黒反転領域を例えば短冊状に分割す
る。そして、短冊領域の白画素密度が所定のスレッショ
ルド(thd5)より少ないか判断する(S13−
3)。すなわち、この処理は白黒反転領域を短冊状に分
割する際、罫線を延長した白黒反転領域の位置に白黒反
転文字が存在する場合、この位置を罫線で仕切ることが
できないので、白黒反転文字の存在を確認するために行
う処理である。したがって、例えば垂直方向に長い線分
抽出マスクを使用し、対象となる白黒反転領域内を線分
抽出マスクで黒画素数の抽出処理を行い、黒画素数が少
ない場合、すなわち白画素数が多い場合、当該位置には
白黒反転文字が存在し、セル分割できない位置であるこ
とが分かる。
FIG. 21 is a flowchart specifically explaining this processing. First, the distance (threshold value (thd
5)) Rule lines separated by more than the above are extracted (S13-1). For example, when the black-and-white inversion area is formed in the horizontal direction, a vertical ruled line is extracted. Next, a strip area in which the ruled line is extended into the black-and-white inversion area is extracted (S13-2). That is, the vertical ruled line extracted as described above is extended into the black-and-white inversion area, and the black-and-white inversion area is divided into, for example, strips. Then, it is determined whether the white pixel density of the strip region is lower than a predetermined threshold (thd5) (S13-
3). That is, when the black-and-white inversion area is divided into strips, if a black-and-white inversion character exists at the position of the black-and-white inversion area where the ruled line is extended, this position cannot be separated by the ruled line. This is a process performed to confirm the above. Therefore, for example, a line segment extraction mask that is long in the vertical direction is used, and the number of black pixels is extracted in the target black-and-white inversion area using the line segment extraction mask. In this case, it can be seen that a black-and-white inverted character exists at the position, and the position cannot be divided into cells.

【0126】ここで、上述の短冊領域の白画素密度が所
定のスレッショルド値(thd5)より少ない場合、短
冊領域の白黒反転領域の輪郭セグメント化を行う(S1
3−4)。そして、上述のセル分割した各白黒反転領域
の輪郭セグメント表現と属性付与を行う(S13−
5)。
Here, if the white pixel density of the above-mentioned strip area is smaller than a predetermined threshold value (thd5), contour segmentation of the black-and-white inversion area of the strip area is performed (S1).
3-4). Then, the contour segment expression and attribute assignment of each of the above-described cell-divided black-and-white inversion areas are performed (S13-
5).

【0127】最後に、白黒反転領域の画素反転処理を行
う(S14)。尚、この処理は図3の画素反転部37が
行う処理である。図22はこの具体的処理を説明するフ
ローチャートである。先ず、白黒反転領域を分割した輪
郭セグメント内の塗りつぶし処理を行う(S14−
1)。次に、白黒反転領域の輪郭セグメント以外の領域
の白黒反転処理を行う(S14−2)。すなわち、上記
塗りつぶし手段によって白黒反転領域の輪郭部分を、例
えば黒色で塗りつぶして枠取りし、その中の白黒反転領
域に対してのみ反転処理を行うものである。例えば、図
19の例で説明すると、線分セグメント列a1〜a4、
b1、b2、c1〜c4、d1、d2を黒色で塗りつぶ
し、その中の白黒反転領域に対して白黒反転処理を行
う。
Finally, the pixel inversion processing of the black and white inversion area is performed (S14). This process is a process performed by the pixel inverting unit 37 in FIG. FIG. 22 is a flowchart for explaining this specific processing. First, a filling process is performed in the outline segment obtained by dividing the black-and-white inversion area (S14-).
1). Next, a black-and-white inversion process is performed on an area other than the outline segment of the black-and-white inversion area (S14-2). That is, the outline portion of the black-and-white inversion area is filled with, for example, black by the above-mentioned filling means to form a frame, and the inversion processing is performed only on the black-and-white inversion area. For example, referring to the example of FIG. 19, line segment segments a1 to a4,
b1, b2, c1 to c4, d1, and d2 are painted in black, and black and white inversion processing is performed on the black and white inversion area therein.

【0128】以上のようにして、白黒反転領域に対する
白黒反転処理を行うと、白黒反転領域内の白抜き文字は
白黒反転し、黒印字となる。尚、図23は上述の白黒反
転処理により反転処理を行った後の状態を示す図であ
る。
As described above, when the black-and-white inversion process is performed on the black-and-white inversion area, the white characters in the black-and-white inversion area are black-and-white inverted and black printed. FIG. 23 is a diagram showing a state after the inversion processing is performed by the above-described black-and-white inversion processing.

【0129】以上のように本例の白黒反転領域識別装置
は水平方向に長い線分抽出マスクと、垂直方向に長い線
分抽出マスクを使用し、統合処理によって白黒反転候補
領域を設定し、白黒反転領域を識別するものであり、白
黒反転領域を正確に識別できる装置である。
As described above, the black-and-white inverted region identification apparatus of this embodiment uses the horizontal long line segment extraction mask and the vertical long line segment extraction mask, sets the black-and-white inversion candidate region by integrated processing, and This is a device for identifying an inversion area, and capable of accurately identifying a black-and-white inversion area.

【0130】尚、本例の白黒反転領域識別装置におい
て、白黒反転領域の決定に連結成分数を算出し、該連結
成分数が所定のスレッショルド値(thd4)以下の時
白黒反転領域と決定したが、本発明は必ずしも連結成分
数の算出、及び該連結成分数による決定処理を必要とす
るものではない。
In the black-and-white inversion area discriminating apparatus of this embodiment, the number of connected components is calculated for determining the black-and-white inversion area, and when the number of connected components is equal to or smaller than a predetermined threshold value (thd4), the black-and-white inversion area is determined. However, the present invention does not necessarily require calculation of the number of connected components and determination processing based on the number of connected components.

【0131】また、本例の説明では白黒反転領域の設定
に図4の処理(S9)を実行し、(重なっている部分の
面積)/垂直方向の白黒反転領域の面積を計算し、この
値とスレッショルド値(thd3)を比較する処理を行
って白黒反転領域の設定を行ったが、水平方向及び垂直
方向の白黒反転候補領域を輪郭線で囲い、当該領域を白
黒反転領域に設定してもよい。
In the description of the present embodiment, the processing (S9) in FIG. 4 is executed to set the black-and-white inversion area, and (area of the overlapping portion) / area of the black-and-white inversion area in the vertical direction is calculated. And the threshold value (thd3) are compared to set the black-and-white inversion area. However, the black-and-white inversion candidate areas in the horizontal direction and the vertical direction are surrounded by outlines, and the area is set as the black-and-white inversion area. Good.

【0132】また、水平方向の線分セグメント列を抽出
し、この線分セグメント列に対して垂直方向の罫線情報
を用い、水平方向の線分セグメント列と垂直方向の罫線
で仕切られた領域を白黒反転領域に設定してもよい。ま
た、必ずしも線分セグメント列を使用する必要はなく、
水平方向の白黒反転候補領域をそのまま使用し、水平方
向の白黒反転候補領域を垂直方向の罫線で仕切り、白黒
反転領域に設定してもよい。
Further, a horizontal line segment sequence is extracted, and vertical ruled line information is used for the line segment sequence to define an area partitioned by the horizontal line segment sequence and the vertical ruled line. It may be set in a black-and-white inversion area. Also, you do n’t have to use line segment columns,
The black-and-white inversion candidate area in the horizontal direction may be used as it is, and the black-and-white inversion candidate area in the horizontal direction may be separated by a vertical ruled line and set as a black-and-white inversion area.

【0133】図24は上述の処理によって白黒反転領域
を設定する例である。すなわち、同図(a)は水平方向
の白黒反転候補領域、と、垂直方向の罫線’、
’で仕切られた領域を白黒反転領域に設定するもので
ある。また、同図(b)に示すもう1つの例は、水平方
向の白黒反転候補領域、が同じ長さである時、両白
黒反転領域、間を白黒反転領域と認定するものであ
る。このように構成することによっても白黒反転領域を
正確に抽出することができる。
FIG. 24 shows an example in which a black-and-white inversion area is set by the above-described processing. That is, FIG. 11A shows a horizontal black-and-white inversion candidate area, and a vertical ruled line ′,
The area separated by 'is set as a black-and-white inversion area. In another example shown in FIG. 3B, when the black-and-white inversion candidate areas in the horizontal direction have the same length, the two black-and-white inversion areas are recognized as black-and-white inversion areas. With such a configuration, the black-and-white inversion area can be accurately extracted.

【0134】一方、上述とは逆に、垂直方向の線分セグ
メント列を抽出し、この線分セグメント列に対して水平
方向の罫線情報を用い、垂直方向の線分セグメント列と
水平方向の罫線で仕切られた領域を白黒反転領域に設定
しても良い。また、必ずしも線分セグメント列を使用す
る必要はなく、垂直方向の白黒反転候補領域をそのまま
使用し、水平方向の罫線で仕切り、白黒反転領域を設定
してもよい。 <第2の実施形態例>次に、本発明の第2の実施形態例
について説明する。
On the other hand, contrary to the above, a vertical line segment sequence is extracted, and the horizontal ruled line information is used for the line segment segment sequence. May be set as a black-and-white inversion area. Further, it is not always necessary to use the line segment line, and the black-and-white inversion candidate area in the vertical direction may be used as it is, divided by horizontal ruled lines, and the black-and-white inversion area may be set. <Second Embodiment> Next, a second embodiment of the present invention will be described.

【0135】尚、本例は上述の白黒反転領域識別装置に
よって白黒反転領が抽出され、当該領域に白黒反転処理
を施すと共に、当該白黒反転領域及び通常のセル内の文
字列に対して認識処理を行い、表全体の認識処理を行う
表認識装置である。
In this example, the black-and-white inversion area is extracted by the above-described black-and-white inversion area identification device, the area is subjected to black-and-white inversion processing, and the recognition processing is performed on the black-and-white inversion area and character strings in normal cells. And performs a recognition process on the entire table.

【0136】尚、本例の処理もプログラムメモリ2に記
憶された表認識処理プログラムに従ってCPU1が実行
する。先ず、図25は本例の表認識装置によって認識の
対象となる帳票原稿の例を示す図である。本例の帳票は
ある会社の例えば社員リストであり、会社名、社員の性
別、電話番号、名前、担当等の項目が記載され、強調等
の必要のため所定の項目には白黒反転領域が設けられて
いる。
The processing of this embodiment is also executed by the CPU 1 in accordance with the table recognition processing program stored in the program memory 2. First, FIG. 25 is a diagram showing an example of a form document to be recognized by the table recognition device of this example. The form in this example is an employee list of a certain company, for example, in which items such as company name, gender of the employee, telephone number, name, charge, etc. are described. Have been.

【0137】この帳票原稿はスキャナー5で読みとら
れ、バス11を介して対応するイメージデータが画像メ
モリ3に格納される。そして、先ず水平方向に長い線分
抽出マスクを用いて線分抽出処理(S1)を行い、抽出
した線分に対して線分統合処理を行う(S2)。尚、垂
直方向に対しても、同時又は水平方向の処理が完了した
後、垂直方向に長い線分抽出マスクを用いて線分抽出処
理(S1’)が行われ、抽出した線分に対して線分統合
処理を行う(S2’)。また、この線分抽出、線分統合
処理は前述の図5及び図7のフローチャートに従って行
われ、白黒反転領域セル又は通常のセルを含む罫線の抽
出が行われる。
The form document is read by the scanner 5, and the corresponding image data is stored in the image memory 3 via the bus 11. First, a line segment extraction process (S1) is performed using a line segment extraction mask that is long in the horizontal direction, and a line segment integration process is performed on the extracted line segments (S2). Note that, also in the vertical direction, after the processing in the horizontal direction or the simultaneous direction is completed, a line segment extraction process (S1 ′) is performed using a line segment extraction mask that is long in the vertical direction, and the extracted line segment is processed. A line segment integration process is performed (S2 '). The line segment extraction and line segment integration processing are performed according to the flowcharts of FIGS. 5 and 7, and a ruled line including a black-and-white inversion area cell or a normal cell is extracted.

【0138】図26は、例えば上述の線分抽出、線分統
合の処理を行った後の状態の表認識結果である。同図に
示すように、白黒反転領域の一部に充分線分統合処理で
きない領域が存在する。すなわち、項目記載の中の「店
名」の記載の一部、「会社名」の記載の一部、等に確実
に線分統合できない箇所がある。尚、この箇所を同図に
T、U、V、Wで示す。この箇所は図25に示す元々の
原稿の状態で“かすれ”等が存在した箇所である。
FIG. 26 shows a table recognition result in a state after the above-described line segment extraction and line segment integration processes have been performed. As shown in the figure, there is an area where line segment integration processing cannot be performed sufficiently in a part of the black-and-white inversion area. That is, there is a portion where line segments cannot be reliably integrated into a part of the description of the “store name”, a part of the description of the “company name”, and the like in the item description. This location is indicated by T, U, V, and W in FIG. This portion is a portion where "blurring" or the like exists in the state of the original document shown in FIG.

【0139】次に、上述のような“かすれ”の箇所に対
する処理として、孤立罫線抽出処理を行う(S6、S
6’)と、上述のような“かすれ”箇所は孤立罫線とし
て抽出される。図27は、例えば上述の処理により抽出
される孤立罫線の状態を表認識出力したと場合の出力結
果である。同図に示すように、上述のT、U、V、Wに
対応する箇所に孤立罫線が形成されている。尚、これら
の罫線を同図にT’、U’、V’、W’で示す。
Next, an isolated ruled line extraction process is performed as a process for the above-mentioned "blurred" portion (S6, S6).
6 ′), the “blurred” portions as described above are extracted as isolated ruled lines. FIG. 27 shows an output result in the case where, for example, the state of an isolated ruled line extracted by the above-described processing is output as a table recognition. As shown in the drawing, isolated ruled lines are formed at locations corresponding to T, U, V, and W described above. Note that these ruled lines are indicated by T ', U', V ', and W' in FIG.

【0140】本例の表認識装置は上述のような孤立罫線
に対しては、孤立罫線と白黒反転候補領域の統合処理に
よって当該領域を全て白黒反転候補領域に補正する(S
7)。すなわち、図27の孤立罫線T’、U’、V’、
W’の左右には何れの場合でも白黒反転候補領域が存在
し、上述の統合処理(S7)によって上記孤立罫線
T’、U’、V’、W’は両側の白黒反転候補領域に統
合される。図28は、上述の処理により孤立罫線が白黒
反転候補領域に統合された状態を出力した結果である。
The table recognizing device of this example corrects all the isolated ruled lines to the black-and-white inversion candidate regions by integrating the isolated ruled lines and the black-and-white inversion candidate regions (S
7). That is, the isolated ruled lines T ′, U ′, V ′,
In either case, there is a black-and-white inversion candidate area on the left and right of W ′, and the above-mentioned isolated ruled lines T ′, U ′, V ′, and W ′ are integrated into the black-and-white inversion candidate area on both sides by the above-described integration processing (S7). You. FIG. 28 shows a result of outputting a state in which the isolated ruled line is integrated into the black-and-white inversion candidate area by the above-described processing.

【0141】次に、水平/垂直の白黒反転候補領域の統
合処理(S8)、白黒反転領域内の連結成分の算出処理
(S9)、この結果に基づく白黒反転領域の決定処理
(S10)を行った後、決定した白黒反転領域に対する
輪郭セグメントを作成する(S11)。図29は、決定
した白黒反転領域に対して輪郭セグメントを形成した状
態を示す図である。
Next, integration processing of horizontal / vertical black-and-white inversion candidate areas (S8), calculation processing of connected components in black-and-white inversion areas (S9), and determination processing of black-and-white inversion areas based on the results (S10) are performed. After that, an outline segment for the determined black-and-white inversion area is created (S11). FIG. 29 is a diagram showing a state in which a contour segment is formed in the determined black-and-white inversion area.

【0142】さらに、図30は上記白黒反転領域内に含
まれるセル領域を抽出するため白黒反転領域内セル分割
処理(S13)を行って表認識出力した結果である。同
図に示すように、本例のセル分割処理は、例えば水平方
向に形成された白黒反転領域に対し、垂直方向の罫線4
0〜45を白黒反転領域内に延長し、セル分割を行うも
のであり、簡単に白黒反転領域内のセル領域を分割処理
できる。また、図30に該当する箇所は存在しないが、
白黒反転領域内のセル領域を分割する際、垂直方向の罫
線の延長線上に文字列があれば、垂直方向の線分抽出マ
スクを用いて黒画素数を検出するので簡単に分割箇所で
はないことを認識することができる。
FIG. 30 shows the result of table recognition and output after performing the cell division process (S13) in the black-and-white inversion area to extract the cell area included in the black-and-white inversion area. As shown in the figure, the cell division processing of this example is performed by, for example, applying a ruled line 4
The cell division is performed by extending 0 to 45 into the black-and-white inversion area, and the cell area in the black-and-white inversion area can be easily divided. Although there is no corresponding part in FIG. 30,
When dividing the cell area in the black and white inversion area, if there is a character string on the extension of the vertical ruled line, the number of black pixels is detected using the vertical line segment extraction mask, so it should not be a simple division Can be recognized.

【0143】以上のようにして白黒反転領域を抽出した
後、白黒反転処理(S14)を実行することによって白
黒反転領域内には反転処理が施される。図31は白黒反
転領域の中で、例えば「会社名」の項目領域を反転処理
した出力結果を示す。
After the black-and-white inversion area is extracted as described above, the black-and-white inversion area is subjected to inversion processing by executing the black-and-white inversion processing (S14). FIG. 31 shows an output result obtained by, for example, inverting the item area of “company name” in the black-and-white inversion area.

【0144】一方、上記白黒反転処理により反転処理さ
れた文字列には、線幅の異常が発生し易い。すなわち、
白黒反転処理により白抜き文字が正確に黒印字されず、
例えば線幅の極めて狭い箇所や逆に広い箇所が生じる。
そこで、本例の表認識装置はこの問題に対処すべく、文
字列の整形処理を行う。
On the other hand, a character string that has been inverted by the above-described black-and-white inversion processing is likely to have an abnormal line width. That is,
White characters are not accurately printed in black due to black and white reversal processing.
For example, there are places where the line width is extremely narrow and places where the line width is wide.
Therefore, the table recognizing device of this example performs a character string shaping process to address this problem.

【0145】図32は画素反転処理後の文字列の整形処
理を説明するフローチャートである。以下、具体的に説
明する。先ず、領域内のパターンの水平方向の平均線幅
を算出する(ステップ(以下STで示す)1)。この算
出は水平方向に白ドットが黒ドットに変わる位置からド
ット数の計数を開始し、次に黒ドットが白ドットに変わ
る位置で計数を終了する。そして、その間に計数したド
ット数を水平方向の線幅とする。次に、垂直方向に対し
ても同様に行い、領域内のパターンの垂直方向の平均線
幅を算出する(ST2)。この算出も垂直方向に白ドッ
トが黒ドットに変わる位置からドット数の計数を開始
し、次に黒ドットが白ドットに変わる位置で計数を終了
する。そして、その間に計数したドット数を垂直方向の
線幅とする。そして、上述の処理を複数回行った結果に
対してパターンの平均線幅を算出する((水平+垂直)
/2)(ST3)。
FIG. 32 is a flowchart for explaining the character string shaping processing after the pixel inversion processing. Hereinafter, a specific description will be given. First, the average line width in the horizontal direction of the pattern in the area is calculated (step (hereinafter, referred to as ST) 1). In this calculation, the counting of the number of dots is started from a position where a white dot changes to a black dot in the horizontal direction, and then the counting is ended at a position where the black dot changes to a white dot. Then, the number of dots counted during that time is defined as the horizontal line width. Next, the same is applied to the vertical direction, and the average line width in the vertical direction of the pattern in the area is calculated (ST2). This calculation also starts counting the number of dots from a position where a white dot changes to a black dot in the vertical direction, and ends counting at a position where a black dot changes to a white dot. Then, the number of dots counted during that time is defined as a vertical line width. Then, the average line width of the pattern is calculated for the result of performing the above processing a plurality of times ((horizontal + vertical))
/ 2) (ST3).

【0146】その後、上述の様にして求めた白黒反転処
理後の文字(列)の平均線幅を所定のスレッショルド値
(thw)と比較する(ST4)。そして、平均線幅が
所定のスレッショルド値(thw)以下であると判断す
る時(ST4が<thw)、膨張処理を行う(ST
5)。一方、文字(列)の平均線幅が所定のスレッショ
ルド値(thw)以上であると判断する時(ST4が>
thw)、収縮処理を行う(ST6)。すなわち、反転
した文字(列)の平均線幅がスレッショルド値(th
w)より狭い場合には膨張処理を行い、線幅が太い場合
には収縮処理を行い、反転処理後の文字(列)の整形を
行う。
Thereafter, the average line width of the character (string) after the black-and-white inversion processing obtained as described above is compared with a predetermined threshold value (thw) (ST4). When it is determined that the average line width is equal to or smaller than a predetermined threshold value (thw) (ST4 is <thw), expansion processing is performed (ST4).
5). On the other hand, when it is determined that the average line width of the character (string) is equal to or greater than a predetermined threshold value (thw) (ST4 is>
thw), a contraction process is performed (ST6). That is, the average line width of the inverted character (column) is equal to the threshold value (th
w) If it is narrower, expansion processing is performed, if line width is thicker, contraction processing is performed, and characters (rows) after inversion processing are shaped.

【0147】以上のようにして、反転処理後の文字
(列)に対する整形処理を行った後、セル領域抽出23
を実行するが、その際本例の表認識装置では既に白黒反
転領域抽出処理の際、罫線抽出と白黒反転領域に対応す
る線分セグメント列には属性が付加されているため容易
に白黒反転領域セルを囲む罫線か、又は通常セルを囲む
罫線か区別することができる。
As described above, after performing the shaping process on the character (string) after the inversion process, the cell region extraction 23
At this time, in the table recognition apparatus of this example, when the black-and-white inverted region is already extracted, the line segment segments corresponding to the ruled line extraction and the black-and-white inverted region are added with an attribute. It can be distinguished from a ruled line surrounding a cell or a ruled line surrounding a normal cell.

【0148】例えば、図33は上述の内容を具体的に説
明する図である。上述のように白黒反転領域に対応する
線分セグメント列には上下、左右の属性は付加されてい
るので各線分セグメント(列)が白黒反転領域のどの位
置に対応するか容易に判断できる。例えば、同図に示す
ように線分セグメント列の上下の属性に囲まれた領域は
白黒反転領域であり、上下の属性が逆の線分セグメント
列に囲まれた領域は通常のセル領域となる。
For example, FIG. 33 is a diagram specifically explaining the above contents. As described above, the vertical and horizontal attributes are added to the line segment line corresponding to the black-and-white inversion area, so that it is easy to determine which position in the black-and-white inversion area each line segment (column) corresponds to. For example, as shown in the figure, the area surrounded by the upper and lower attributes of the line segment row is a black-and-white inversion area, and the area surrounded by the line segment row with the upper and lower attributes reversed is a normal cell area. .

【0149】以上の処理の後、各セル内の文字列に対す
る認識処理を行い、帳票フォームと共に文字列に対する
認識結果を含む表出力を行う。尚、前述の図30は最終
的な本例の表認識装置の出力結果でもある。
After the above processing, recognition processing is performed on the character string in each cell, and a table including the recognition result of the character string is output together with the form. FIG. 30 also shows the final output result of the table recognition device of this example.

【0150】[0150]

【発明の効果】以上説明したように本発明によれば、以
下の効果が得られる。すなわち、本発明の白黒反転領域
識別装置によれば、一つのセル内の一部に白黒反転領域
が存在する場合でも正確にその領域を識別することがで
きる。また、白黒反転領域内に大きいサイズの反転文字
が存在する場合でも、本発明で使用する線分抽出マスク
は極めて細く比較的短いマスクを使用するので白黒反転
領域を正確に識別することができる。さらに、表画像が
傾いて読み出された場合でも、狭い範囲の黒画素数を認
識しつつ統合処理により白黒反転領域を識別するので、
傾斜のある状態の白黒反転領域として認識できる。
As described above, according to the present invention, the following effects can be obtained. That is, according to the black-and-white inversion area identification device of the present invention, even when a black-and-white inversion area exists in a part of one cell, the area can be accurately identified. Further, even when a large size inverted character exists in the black-and-white inverted region, the line segment extraction mask used in the present invention uses an extremely thin and relatively short mask, so that the black-and-white inverted region can be accurately identified. Furthermore, even when the front image is read with inclination, the black-and-white inversion area is identified by the integration processing while recognizing the number of black pixels in a narrow range.
It can be recognized as a black-and-white inversion area with an inclined state.

【0151】また、本発明の一態様によれば、白黒反転
領域に例えば“かすれ”等が存在する場合でも、孤立罫
線処理により救済するため、白黒反転領域を正確に識別
することができる。
Further, according to one aspect of the present invention, even when, for example, “blurring” or the like exists in the black-and-white inversion area, the black-and-white inversion area can be accurately identified because it is repaired by the isolated rule processing.

【0152】また、本発明の一態様によれば、作成され
た線分セグメント列の白黒反転領域に対する位置が明確
になり、例えば白黒反転領域と通常のセル領域を区別す
る際、容易に行うことができる。
Further, according to one aspect of the present invention, the position of the created line segment sequence with respect to the black-and-white inversion area is clarified, and, for example, when the black-and-white inversion area is distinguished from the normal cell area, it can be easily performed. Can be.

【0153】また、本発明の一態様によれば、白黒反転
領域を例えば短冊状に分割して水平方向又は垂直方向の
罫線によって仕切られた領域をセル領域とするので、簡
単に白黒反転領域内をセル分割することができる。
Further, according to one aspect of the present invention, the black-and-white inversion area is divided into, for example, strips, and the area partitioned by horizontal or vertical ruled lines is used as the cell area. Can be divided into cells.

【0154】本発明の表認識装置によれば、一つのセル
内の一部に白黒反転領域が存在する場合でも反転領域を
正確に識別することができ、白黒反転領域内に大きいサ
イズの反転文字が存在する場合でも、その領域を正確に
識別することができ、表画像が傾いて読み出された場合
でも白黒反転領域を正確に識別することができる。
According to the table recognizing device of the present invention, even when a black-and-white inverted area exists in a part of one cell, the inverted area can be accurately identified, and a large-size inverted character is included in the black-and-white inverted area. Is present, the area can be accurately identified, and even when the front image is read with inclination, the black-and-white inversion area can be accurately identified.

【0155】また、本発明によれば、処理プログラムを
ハードディスク、ICメモリカード、磁気テープ、フロ
ッピーディスク、又は光ディスクなどの記憶媒体に記憶
し、必要に応じて読み出し白黒反転領域の識別、表認識
処理を行うことができる。
Further, according to the present invention, the processing program is stored in a storage medium such as a hard disk, an IC memory card, a magnetic tape, a floppy disk, or an optical disk, and read out as necessary to identify a black-and-white inversion area and to perform table recognition processing. It can be performed.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本実施形態例の白黒反転領域認識装置を含む表
認識装置のシステム構成図である。
FIG. 1 is a system configuration diagram of a table recognition device including a black-and-white inversion area recognition device of the embodiment.

【図2】CPUが行う認識処理を説明する図である。FIG. 2 is a diagram illustrating a recognition process performed by a CPU.

【図3】CPUが行う処理を具体的に説明するシステム
構成図である
FIG. 3 is a system configuration diagram specifically illustrating processing performed by a CPU;

【図4】第1の実施形態例の処理を説明するフローチャ
ートである。
FIG. 4 is a flowchart illustrating a process according to the first embodiment;

【図5】線分抽出処理(S1)を具体的に説明するフロ
ーチャートである。
FIG. 5 is a flowchart specifically illustrating a line segment extraction process (S1).

【図6】m×n(縦×横)が1×6の画素(ドット)の
領域を指定する線分抽出マスクにより、水平方向成分を
抽出する場合を説明するものである。
FIG. 6 illustrates a case where a horizontal component is extracted by a line segment extraction mask that specifies an area of pixels (dots) whose m × n (length × width) is 1 × 6.

【図7】線分統合処理を具体的に説明するフローチャー
トである。
FIG. 7 is a flowchart specifically illustrating a line segment integration process;

【図8】線分統合処理の結果を示す図である。FIG. 8 is a diagram showing a result of a line segment integration process.

【図9】線分統合処理の結果を示す図である。FIG. 9 is a diagram illustrating a result of a line segment integration process.

【図10】罫線抽出処理のフローチャートである。FIG. 10 is a flowchart of a ruled line extraction process.

【図11】孤立罫線抽出処理を説明するフローチャート
である。
FIG. 11 is a flowchart illustrating an isolated ruled line extraction process.

【図12】孤立罫線と白黒反転候補領域の統合処理を具
体的に説明するフローチャートである。
FIG. 12 is a flowchart specifically illustrating an integration process of an isolated ruled line and a black-and-white inversion candidate region.

【図13】水平/垂直の白黒反転候補領域の統合処理を
具体的に説明するフローチャートである。
FIG. 13 is a flowchart specifically illustrating a process of integrating horizontal / vertical black-and-white inversion candidate areas.

【図14】水平/垂直の白黒反転候補領域の統合処理を
説明する図である。
FIG. 14 is a diagram illustrating the integration processing of horizontal / vertical black-and-white inversion candidate areas.

【図15】連結成分の算出処理を具体的に説明するフロ
ーチャートである。
FIG. 15 is a flowchart specifically illustrating a connected component calculation process.

【図16】白黒反転領域決定のフローチャートである。FIG. 16 is a flowchart of determining a black-and-white inversion area.

【図17】黒印字部は背景の黒部1個と、文字列「会社
名」に含まれる独立の黒印字部(例えば6個)の合計7
個の連結成分数を説明する図である。
FIG. 17 shows a total of seven black printing parts, including one black part in the background and independent black printing parts (for example, six) included in the character string “company name”.
It is a figure explaining the number of connected components.

【図18】白黒反転領域の輪郭セグメント表現を行う処
理を具体的に説明するフローチャートである。
FIG. 18 is a flowchart specifically illustrating a process of expressing a contour segment of a black-and-white inversion area.

【図19】抽出する領域(線分)がずれて抽出される例
を説明する図である
FIG. 19 is a diagram illustrating an example in which an area (line segment) to be extracted is extracted with a shift;

【図20】白黒反転領域の属性付与処理を具体的に示す
フローチャートである。
FIG. 20 is a flowchart specifically showing an attribute assigning process for a black-and-white inversion area.

【図21】白黒反転領域内セル分割のフローチャートで
ある。
FIG. 21 is a flowchart of cell division in a black-and-white inversion area.

【図22】白黒反転領域の画素反転処理を説明するフロ
ーチャートである。
FIG. 22 is a flowchart illustrating a pixel inversion process in a black-and-white inversion area.

【図23】白黒反転処理により反転処理を行った後の状
態を示す図である。
FIG. 23 is a diagram illustrating a state after the inversion processing is performed by the black-and-white inversion processing.

【図24】白黒反転領域を設定する例である。FIG. 24 is an example of setting a black-and-white inversion area.

【図25】第2の実施形態例を説明する表認識の対象と
なる帳票原稿の例を示す図である。
FIG. 25 is a diagram showing an example of a form document to be subjected to table recognition for explaining the second embodiment.

【図26】線分抽出、線分統合の処理を行った後の状態
で表認識出力したと仮定した場合の本例の表認識装置か
らの出力結果である罫線抽出処理のフローチャートであ
る。
FIG. 26 is a flowchart of a ruled line extraction process as an output result from the table recognition device of the present example when it is assumed that table recognition and output have been performed after the line segment extraction and line segment integration processes have been performed.

【図27】抽出される孤立罫線の状態を表認識出力した
と場合の出力結果である。
FIG. 27 shows an output result when the state of the isolated ruled line to be extracted is output as a table recognition.

【図28】孤立罫線が白黒反転候補領域に統合された状
態を出力した結果である。
FIG. 28 shows a result of outputting a state in which an isolated ruled line is integrated into a black-and-white inversion candidate area.

【図29】決定した白黒反転領域に対して輪郭セグメン
トを形成した状態を示す図である。
FIG. 29 is a diagram showing a state in which a contour segment is formed in the determined black-and-white inversion area.

【図30】白黒反転領域内に含まれるセル領域を抽出す
るため白黒反転領域内セル分割処理を行って表認識出力
した結果である。
FIG. 30 shows a result of performing table recognition output by performing a cell division process in a black-and-white inversion area to extract a cell area included in the black-and-white inversion area.

【図31】白黒反転領域の中で、例えば「会社名」の項
目領域を反転処理した出力結果を示す図である。
FIG. 31 is a diagram showing an output result obtained by inverting an item area of, for example, “company name” in a black-and-white inversion area.

【図32】画素反転処理後の文字列の整形処理を説明す
るフローチャートである。
FIG. 32 is a flowchart illustrating a character string shaping process after the pixel inversion process.

【図33】白黒反転領域セルを囲む罫線か、又は通常セ
ルを囲む罫線か容易に区別できることを説明する図であ
る。
FIG. 33 is a diagram illustrating that a ruled line surrounding a black-and-white inverted area cell or a ruled line surrounding a normal cell can be easily distinguished.

【図34】従来例の表認識システムを説明する図であ
る。
FIG. 34 is a diagram illustrating a conventional table recognition system.

【図35】(a)はランの構成を説明する図であり、
(b)は白黒反転領域を説明する図であり、(c)は白
黒反転領域内の全ての領域が白黒反転領域ではないこと
を示す図である。
FIG. 35 (a) is a diagram illustrating the configuration of a run.
(B) is a diagram for explaining a black-and-white inversion region, and (c) is a diagram showing that all regions in the black-and-white inversion region are not black-and-white inversion regions.

【符号の説明】[Explanation of symbols]

1 中央演算処理ユニット(CPU) 2 プログラムメモリ 3 画像メモリ 4 ワークメモリ 5 スキャナ 6 メモリ 7 辞書ファイル 8 ディスプレイ 9 プリンタ 10 インターフェイス回路 11 バス 12 ドライバ 13 ハードディスク 14 ICメモリカード 15 磁気テープ 16 フロッピーディスク 17 光ディスク 19 通信インターフェイス 20 画像入力 21 線分抽出 22 白黒反転領域抽出 23 セル領域抽出 24 セル内項目抽出 25 文字認識 30 画像入力部 31 画像領域格納部 32 線分抽出部 33 線分統合部 34 罫線抽出部 35 白黒反転領域決定部 36 白黒反転領域内セル決定部 37 画素反転部 40〜45 罫線 Reference Signs List 1 Central processing unit (CPU) 2 Program memory 3 Image memory 4 Work memory 5 Scanner 6 Memory 7 Dictionary file 8 Display 9 Printer 10 Interface circuit 11 Bus 12 Driver 13 Hard disk 14 IC memory card 15 Magnetic tape 16 Floppy disk 17 Optical disk 19 Communication interface 20 Image input 21 Line segment extraction 22 Black-and-white inverted region extraction 23 Cell region extraction 24 Cell item extraction 25 Character recognition 30 Image input unit 31 Image region storage unit 32 Line extraction unit 33 Line integration unit 34 Rule line extraction unit 35 Black / white inversion area determination unit 36 Black / white inversion area cell determination unit 37 Pixel inversion unit 40-45 Ruled line

Claims (30)

【特許請求の範囲】[Claims] 【請求項1】 表形式の2値イメージデータに対し、水
平方向に長い線分抽出マスクを用いて水平方向に走査
し、垂直方向に長い線分抽出マスクを用いて垂直方向に
走査し、黒画素密度が所定の閾値より高い領域をそれぞ
れ抽出する領域抽出手段と、 該領域抽出手段で抽出した前記黒画素密度の高い領域を
それぞれのマスク走査方向に直交する方向で統合する第
1の統合手段と、 該第1の統合手段で統合した領域の線幅が所定の閾値以
上であれば白黒反転候補領域であるとし、該白黒反転候
補領域をそれぞれのマスク走査方向に統合する第2の統
合手段と、 該第2の統合手段で統合した白黒反転候補領域の輪郭に
対し、水平方向及び垂直方向の線分セグメント列を作成
する線分セグメント列作成手段と、 該線分セグメント列作成手段で作成された水平方向の線
分セグメント列と垂直方向の線分セグメント列で囲まれ
た領域を白黒反転領域に設定する白黒反転領域設定手段
と、 を備えたことを特徴とする白黒反転領域識別装置。
1. A table format binary image data is scanned in the horizontal direction using a line segment extraction mask that is long in the horizontal direction, and is vertically scanned using a line segment extraction mask that is long in the vertical direction. Region extracting means for respectively extracting regions having a pixel density higher than a predetermined threshold; and first integrating means for integrating the regions having a high black pixel density extracted by the region extracting means in a direction orthogonal to the respective mask scanning directions. If the line width of the area integrated by the first integration means is equal to or greater than a predetermined threshold, the area is determined to be a black and white inversion candidate area, and the black and white inversion candidate area is integrated in each mask scanning direction. Line segment segment creating means for creating horizontal and vertical line segment segment strings for the outline of the black-and-white inversion candidate area integrated by the second integrating means; Tone reversal region identification apparatus characterized by comprising: a tone reversal region setting means for setting a region surrounded by horizontal line segments rows and vertical line segment row in tone reversal region, the.
【請求項2】 表形式の2値イメージデータに対し、水
平方向に長い線分抽出マスクを用いて水平方向に走査
し、垂直方向に長い線分抽出マスクを用いて垂直方向に
走査し、黒画素密度が所定の閾値より高い領域をそれぞ
れ抽出する領域抽出手段と、 該領域抽出手段で抽出した前記黒画素密度の高い領域を
それぞれのマスク走査方向に直交する方向で統合する第
1の統合手段と、 該第1の統合手段で統合した領域の線幅が所定の閾値以
上であれば白黒反転候補領域であるとし、該白黒反転候
補領域をそれぞれのマスク走査方向に統合する第2の統
合手段と、 該第2の統合手段で統合した水平方向の白黒反転候補領
域と垂直方向の白黒反転候補領域の重なり状態により白
黒反転領域を設定する白黒反転領域設定手段と、 を備えたことを特徴とする白黒反転領域識別装置。
2. The table-format binary image data is scanned in the horizontal direction using a line extraction mask that is long in the horizontal direction, and is scanned in the vertical direction using the line extraction mask that is long in the vertical direction. Region extracting means for respectively extracting regions having a pixel density higher than a predetermined threshold; and first integrating means for integrating the regions having a high black pixel density extracted by the region extracting means in a direction orthogonal to the respective mask scanning directions. If the line width of the area integrated by the first integration means is equal to or greater than a predetermined threshold, the area is determined to be a black and white inversion candidate area, and the black and white inversion candidate area is integrated in each mask scanning direction. And black-and-white inversion area setting means for setting a black-and-white inversion area based on the overlapping state of the horizontal and black-and-white inversion candidate areas integrated by the second integration means. That black-and-white inversion region identification device.
【請求項3】 前記第1の統合手段で統合した領域の線
幅が所定の閾値以下であると判断するとき、前記第1の
統合手段で統合した領域を罫線であると判断する罫線判
断手段を有することを特徴とする請求項1又は2記載の
白黒反転領域識別装置。
3. A ruled line determining means for determining that the area integrated by the first integrating means is a ruled line when determining that the line width of the area integrated by the first integrating means is equal to or smaller than a predetermined threshold value. The black-and-white inversion area identification device according to claim 1 or 2, further comprising:
【請求項4】 前記罫線判断手段で判断した罫線をそれ
ぞれのマスク走査方向に統合して罫線を作成する罫線作
成手段を有することを特徴とする請求項3記載の白黒反
転領域識別装置。
4. A black-and-white inversion area identifying apparatus according to claim 3, further comprising a ruled line creating means for creating a ruled line by integrating the ruled lines determined by said ruled line determining means in respective mask scanning directions.
【請求項5】 前記罫線作成手段が垂直方向の罫線を作
成する場合、前記線分セグメント列作成手段で作成した
水平方向の線分セグメント列と、前記垂直方向の罫線間
で囲まれた領域を白黒反転領域とすることを特徴とする
請求項4記載の白黒反転領域識別装置。
5. When the ruled line creating means creates a ruled line in the vertical direction, an area enclosed between the horizontal line segment segment created by the line segmented string creating means and the vertical ruled line is defined. 5. The black-and-white inversion area identification device according to claim 4, wherein the black-and-white inversion area is used.
【請求項6】 前記罫線作成手段が水平方向の罫線を作
成する場合、前記線分セグメント列作成手段で作成した
垂直方向の線分セグメント列と、前記水平方向の罫線間
で囲まれた領域を白黒反転領域とすることを特徴とする
請求項4記載の白黒反転領域識別装置。
6. When the ruled line creating means creates a horizontal ruled line, an area enclosed between the vertical line segment segment created by the line segment segmented creating means and the horizontal ruled line is defined. 5. The black-and-white inversion area identification device according to claim 4, wherein the black-and-white inversion area is used.
【請求項7】 前記白黒反転領域の輪郭の凹凸を吸収す
るマージンが、前記線分セグメント列に付加されている
ことを特徴とする請求項1、又は5、又は6記載の白黒
反転領域識別装置。
7. The black-and-white inverting region identification apparatus according to claim 1, wherein a margin for absorbing irregularities in the outline of the black-and-white inverting region is added to the line segment row. .
【請求項8】 前記白黒反転領域設定手段は、連結成分
数が所定の閾値以下であるとき、白黒反転領域の設定を
行うことを特徴とする請求項1又は2記載の白黒反転領
域識別装置。
8. The black-and-white inversion area identification device according to claim 1, wherein said black-and-white inversion area setting means sets a black-and-white inversion area when the number of connected components is equal to or less than a predetermined threshold value.
【請求項9】 前記連結成分数を算出する算出手段と、
該算出手段で算出した連結成分数が所定の閾値以下であ
ることを識別する識別手段とを有することを特徴とする
請求項8記載の白黒反転領域識別装置。
9. A calculating means for calculating the number of connected components,
9. The black-and-white inversion area identification device according to claim 8, further comprising identification means for identifying that the number of connected components calculated by said calculation means is equal to or less than a predetermined threshold value.
【請求項10】 孤立した罫線候補を抽出し、該孤立し
た罫線候補の周辺に前記白黒反転候補領域が存在する
時、前記孤立した罫線候補も白黒反転候補領域に統合す
る孤立罫線統合手段をさらに有することを特徴とする請
求項1又は2記載の白黒反転領域識別装置。
10. An isolated ruled line integrating means for extracting an isolated ruled line candidate and integrating the isolated ruled line candidate into the black-and-white inverted candidate region when the black-and-white inverted candidate region exists around the isolated ruled-line candidate. The black-and-white inversion area identification device according to claim 1 or 2, further comprising:
【請求項11】 前記孤立した罫線候補の抽出は、文字
領域と罫線領域を区別する手段を備え、罫線抽出処理後
に白黒反転領域を抽出することを特徴とする請求項10
記載の白黒反転領域識別装置。
11. The extraction of the isolated ruled line candidate comprises means for distinguishing a character region from a ruled line region, and extracting a black-and-white inversion region after the ruled line extraction processing.
The black-and-white inversion area identification device described in the above.
【請求項12】 前記線分セグメント列には、該線分セ
グメント列が白黒反転領域であることを示す属性が付加
されていることを特徴とする請求項1記載の白黒反転領
域識別装置。
12. The black-and-white inversion area identification device according to claim 1, wherein an attribute indicating that the line-segment row is a black-and-white inversion area is added to the line segment segment row.
【請求項13】 前記線分セグメント列には、白黒反転
領域に対する前記線分セグメント列の位置が、上下又は
左右の辺の位置情報として付加されていることを特徴と
する請求項12記載の白黒反転領域識別装置。
13. The monochrome image according to claim 12, wherein the position of the line segment segment with respect to the black-and-white inversion area is added to the line segment line as positional information of upper and lower or left and right sides. Reversal area identification device.
【請求項14】表のセル構造を解析する際、該セルの位
置情報が、前記線分セグメント列に付加された上下又は
左右の辺の位置情報と同じ場合には白黒反転セル領域と
判断し、異なる場合には通常のセル領域と判断すること
を特徴とする請求項13記載の白黒反転領域識別装置。
14. When analyzing the cell structure of the table, if the position information of the cell is the same as the position information of the upper and lower or left and right sides added to the line segment segment row, it is determined that the cell is a black-and-white inverted cell area. 14. The black-and-white inversion area identification device according to claim 13, wherein if different, a normal cell area is determined.
【請求項15】前記白黒反転領域内が複数のセル領域よ
り成る場合、前記白黒反転領域に接続する罫線を延長し
て白黒反転領域内の前記セル領域を抽出することを特徴
とする請求項1又は2記載の白黒反転領域識別装置。
15. When the inside of the black-and-white inversion area includes a plurality of cell areas, a ruled line connected to the black-and-white inversion area is extended to extract the cell area in the black-and-white inversion area. Or the black-and-white inversion area identification device according to 2.
【請求項16】前記白黒反転領域内のセルを分割する
際、白黒反転領域に接続する罫線を延長した領域を細分
割して黒画素密度を求める手段を有することを特徴とす
る請求項15記載の白黒反転領域識別装置。
16. The method according to claim 15, further comprising, when dividing the cells in the black-and-white inversion area, obtaining a black pixel density by subdividing an area in which a ruled line connected to the black-and-white inversion area is extended. Black and white reversal area identification device.
【請求項17】 表形式の2値イメージデータに対し、
水平方向に長い線分抽出マスクを用いて水平方向に走査
し、垂直方向に長い線分抽出マスクを用いて垂直方向に
走査し、黒画素密度が所定の閾値より高い領域をそれぞ
れ抽出する領域抽出手段と、該領域抽出手段で抽出した
前記黒画素密度の高い領域をそれぞれのマスク走査方向
に直交する方向で統合する第1の統合手段と、該第1の
統合手段で統合した領域の線幅が所定の閾値以上であれ
ば白黒反転候補領域であるとし、該白黒反転候補領域を
それぞれのマスク走査方向に統合する第2の統合手段
と、該第2の統合手段で統合した白黒反転候補領域の輪
郭に対し、水平方向及び垂直方向の線分セグメント列を
作成する線分セグメント列作成手段と、該線分セグメン
ト列作成手段で作成した水平方向の線分セグメント列と
垂直方向の線分セグメント列で囲まれた領域を白黒反転
領域に設定する白黒反転領域設定手段とを備えた白黒反
転領域識別部と、 該白黒反転領域認識部により識別された白黒反転領域に
対し、白黒反転処理を施す白黒反転処理手段と、 該白黒反転処理手段によって反転処理された領域に位置
する文字列に対して認識処理を行う認識手段と、 を有することを特徴とする表認識装置。
17. For binary image data in a table format,
An area extraction that scans in the horizontal direction using a line extraction mask that is long in the horizontal direction and scans in the vertical direction using a line extraction mask that is long in the vertical direction, and extracts areas where the black pixel density is higher than a predetermined threshold value Means, first integration means for integrating the areas having a high black pixel density extracted by the area extraction means in a direction orthogonal to the respective mask scanning directions, and line width of the area integrated by the first integration means Is greater than or equal to a predetermined threshold value, it is determined that the black-and-white reversal candidate area is a black-and-white reversal candidate area, and a black-and-white reversal candidate area integrated by the second integration means. Line segment segment sequence creating means for creating horizontal and vertical line segment segment sequences for the contours of, and the horizontal line segment segment sequence and the vertical line segment segment created by the line segment segment sequence creating device. And a black-and-white inversion area setting unit for setting a region surrounded by the print sequence as a black-and-white inversion area, and a black-and-white inversion processing performed on the black-and-white inversion area identified by the black-and-white inversion area recognition unit. A table recognizing device comprising: a black-and-white inversion processing unit for performing; and a recognition unit for performing a recognition process on a character string located in an area subjected to the black-and-white inversion processing unit.
【請求項18】 表形式の2値イメージデータに対し、
水平方向に長い線分抽出マスクを用いて水平方向に走査
し、垂直方向に長い線分抽出マスクを用いて垂直方向に
走査し、黒画素密度が所定の閾値より高い領域をそれぞ
れ抽出する領域抽出手段と、該領域抽出手段で抽出した
前記黒画素密度の高い領域をそれぞれのマスク走査方向
に直交する方向で統合する第1の統合手段と、該第1の
統合手段で統合した領域の線幅が所定の閾値以上であれ
ば白黒反転候補領域であるとし、該白黒反転候補領域を
それぞれのマスク走査方向に統合する第2の統合手段
と、該第2の統合手段で統合した水平方向の白黒反転候
補領域と垂直方向の白黒反転候補領域の重なり状態によ
り白黒反転領域を設定する白黒反転領域設定手段とを備
えた白黒反転領域識別部と、 該白黒反転領域認識部により識別された白黒反転領域に
対し、白黒反転処理を行う白黒反転処理手段と、 該白黒反転処理手段によって反転処理された領域に位置
する文字列に対して認識処理を行う認識手段と、 を有することを特徴とする表認識装置。
18. Binary image data in a table format
An area extraction that scans in the horizontal direction using a line extraction mask that is long in the horizontal direction and scans in the vertical direction using a line extraction mask that is long in the vertical direction, and extracts areas where the black pixel density is higher than a predetermined threshold value Means, first integration means for integrating the areas having a high black pixel density extracted by the area extraction means in a direction orthogonal to the respective mask scanning directions, and line width of the area integrated by the first integration means Is greater than or equal to a predetermined threshold, it is determined that the black-and-white inversion candidate area is a black-and-white inversion candidate area, and the horizontal integration of black and white in the respective mask scanning directions is performed by the second integration means. A black-and-white inversion area identification unit including black-and-white inversion area setting means for setting a black-and-white inversion area according to the overlapping state of the black-and-white inversion area and the black-and-white inversion area recognition unit; Black-and-white inversion processing means for performing black-and-white inversion processing on the inverted area, and recognition means for performing recognition processing on a character string located in the area inverted by the black-and-white inversion processing means. Table recognition device.
【請求項19】 前記白黒反転処理手段は、前記白黒反
転領域の輪郭セグメントを塗りつぶす塗りつぶし手段
と、前記輪郭セグメント列以外の白黒反転領域を白黒反
転する処理手段を具備することを特徴とする請求項17
記載の表認識装置。
19. The black-and-white inversion processing unit includes a filling unit that fills an outline segment of the black-and-white inversion region, and a processing unit that performs black-and-white inversion of a black-and-white inversion region other than the outline segment row. 17
Table recognition device as described.
【請求項20】 前記白黒反転処理手段は、セルによっ
て分割された領域を塗りつぶすセル領域塗りつぶし手段
を有することを特徴とする請求項19記載の表認識装
置。
20. The table recognition apparatus according to claim 19, wherein said black-and-white inversion processing means has a cell area filling means for filling an area divided by cells.
【請求項21】 前記白黒反転処理手段によって反転処
理された白黒反転領域に位置する文字列の線幅を算出
し、該算出した線幅に従って前記文字列を膨張又は収縮
処理し、前記文字列を整形することを特徴とする請求項
17又は18記載の表認識装置。
21. A line width of a character string located in a black-and-white inversion area subjected to the black-and-white inversion processing means is calculated, and the character string is expanded or contracted in accordance with the calculated line width. The table recognition device according to claim 17, wherein the table recognition is performed.
【請求項22】 前記白黒反転領域設定手段は、連結成
分数が所定の閾値以下である場合、白黒反転領域の設定
を行うことを特徴とする請求項17又は18記載の表認
識装置。
22. The table recognition apparatus according to claim 17, wherein said black-and-white inversion area setting means sets a black-and-white inversion area when the number of connected components is equal to or less than a predetermined threshold value.
【請求項23】 前記領域抽出手段は孤立した罫線候補
を抽出し、該孤立した罫線候補の周辺に前記白黒反転候
補領域が存在する時、前記孤立した罫線候補も白黒反転
候補領域に統合する孤立罫線統合手段を有することを特
徴とする請求項17又は18記載の表認識装置。
23. The area extracting means extracts an isolated ruled line candidate, and when the black-and-white inversion candidate area exists around the isolated ruled-line candidate, the isolated ruled-line candidate is also integrated into the black-and-white inversion candidate area. 19. The table recognizing device according to claim 17, further comprising ruled line integrating means.
【請求項24】 前記線分セグメント列には、該線分セ
グメント列が白黒反転領域であることを示す属性が付加
されていることを特徴とする請求項17記載の表認識装
置。
24. The table recognition apparatus according to claim 17, wherein an attribute indicating that the line segment segment is a black-and-white inversion area is added to the line segment segment.
【請求項25】前記白黒反転領域内が複数のセル領域よ
り成る場合、前記白黒反転領域に接続する罫線を延長し
て白黒反転領域内の前記セル領域を抽出することを特徴
とする請求項17又は18記載の表認識装置。
25. When the inside of the black-and-white inversion area is composed of a plurality of cell areas, a ruled line connected to the black-and-white inversion area is extended to extract the cell area in the black-and-white inversion area. Or the table recognition device according to 18.
【請求項26】前記白黒反転領域内のセルを分割する
際、白黒反転領域に接続する罫線を延長した領域を細分
割して黒画素密度を求める手段を有することを特徴とす
る請求項25記載の表認識装置。
26. The apparatus according to claim 25, wherein, when dividing the cells in the black-and-white inversion area, means for obtaining a black pixel density by subdividing an area obtained by extending a ruled line connected to the black-and-white inversion area is provided. Table recognition device.
【請求項27】 表形式の2値イメージデータに対し、
水平方向に長い線分抽出マスクを用いて水平方向に走査
し、垂直方向に長い線分抽出マスクを用いて垂直方向に
走査し、黒画素密度が所定の閾値より高い領域をそれぞ
れ抽出する機能と、 該機能で抽出した前記黒画素密度の高い領域をそれぞれ
のマスク走査方向に直交する方向で統合する機能と、 該機能で統合した領域の線幅が所定の閾値以上であれば
白黒反転候補領域であるとし、該白黒反転候補領域をそ
れぞれのマスク走査方向に統合する機能と、 該機能で統合した白黒反転候補領域の輪郭に対し、水平
方向及び垂直方向の線分セグメント列を作成する機能
と、 該機能で作成された水平方向の線分セグメント列と垂直
方向の線分セグメント列で囲まれた領域を白黒反転領域
に設定する機能と、 をコンピュータに実行させる命令を含むプログラムを格
納した前記コンピュータが読み取り可能な記憶媒体。
27. For binary image data in table format,
A function of scanning in the horizontal direction using a long line segment extraction mask in the horizontal direction and a vertical direction using a long line segment extraction mask in the vertical direction, and extracting a region where the black pixel density is higher than a predetermined threshold value; A function of integrating the areas having a high black pixel density extracted by the function in a direction orthogonal to the respective mask scanning directions; and a black-and-white inversion candidate area if the line width of the area integrated by the function is equal to or more than a predetermined threshold. A function of integrating the black-and-white inversion candidate areas in the respective mask scanning directions; and a function of creating horizontal and vertical line segment segments for the outline of the black-and-white inversion candidate areas integrated by the function. And a function of setting a region surrounded by the horizontal line segment segments and the vertical line segment segments created by the function as a black-and-white inversion region, and an instruction for causing a computer to execute The computer-readable storage medium storing the program.
【請求項28】 表形式の2値イメージデータに対し、
水平方向に長い線分抽出マスクを用いて水平方向に走査
し、垂直方向に長い線分抽出マスクを用いて垂直方向に
走査し、黒画素密度が所定の閾値より高い領域をそれぞ
れ抽出する機能と、 該機能で抽出した前記黒画素密度の高い領域をそれぞれ
のマスク走査方向に直交する方向で統合する機能と、 該機能で統合した領域の線幅が所定の閾値以上であれば
白黒反転候補領域であるとし、該白黒反転候補領域をそ
れぞれのマスク走査方向に統合する機能と、 該機能で統合した水平方向の白黒反転候補領域と垂直方
向の白黒反転候補領域の重なり状態により白黒反転領域
を設定する機能と、 をコンピュータに実行させる命令を含むプログラムを格
納した前記コンピュータが読み取り可能な記憶媒体。
28. For binary image data in a table format,
A function of scanning in the horizontal direction using a long line segment extraction mask in the horizontal direction and a vertical direction using a long line segment extraction mask in the vertical direction, and extracting a region where the black pixel density is higher than a predetermined threshold value; A function of integrating the areas having a high black pixel density extracted by the function in a direction orthogonal to the respective mask scanning directions; and a black-and-white inversion candidate area if the line width of the area integrated by the function is equal to or more than a predetermined threshold. And a function of integrating the black-and-white inversion candidate areas in the respective mask scanning directions, and setting of a black-and-white inversion area based on an overlapping state of the horizontal and black-and-white inversion candidate areas integrated by the function. And a computer-readable storage medium storing a program including an instruction to cause a computer to execute the function.
【請求項29】前記白黒反転領域に示す白黒には色の三
要素によって作成される任意の2色を含むことを特徴と
する請求項1又は2記載の白黒反転領域識別装置。
29. The black-and-white inverted area discriminating apparatus according to claim 1, wherein the black and white shown in the black-and-white inverted area includes any two colors created by three elements of colors.
【請求項30】前記白黒反転領域に示す白黒には色の三
要素によって作成される任意の2色を含むことを特徴と
する請求項17又は18記載の表認識装置。
30. The table recognition apparatus according to claim 17, wherein the black and white shown in the black and white reversal area includes any two colors created by three elements of colors.
JP14270897A 1997-05-30 1997-05-30 Black and white reversal area identification device and table recognition device using the device Expired - Fee Related JP3409992B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP14270897A JP3409992B2 (en) 1997-05-30 1997-05-30 Black and white reversal area identification device and table recognition device using the device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP14270897A JP3409992B2 (en) 1997-05-30 1997-05-30 Black and white reversal area identification device and table recognition device using the device

Publications (2)

Publication Number Publication Date
JPH10334183A true JPH10334183A (en) 1998-12-18
JP3409992B2 JP3409992B2 (en) 2003-05-26

Family

ID=15321729

Family Applications (1)

Application Number Title Priority Date Filing Date
JP14270897A Expired - Fee Related JP3409992B2 (en) 1997-05-30 1997-05-30 Black and white reversal area identification device and table recognition device using the device

Country Status (1)

Country Link
JP (1) JP3409992B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008083760A (en) * 2006-09-26 2008-04-10 Oki Electric Ind Co Ltd Business form reader

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106295486B (en) * 2015-06-12 2019-11-05 富士通株式会社 The processing method and processing unit of file and picture

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008083760A (en) * 2006-09-26 2008-04-10 Oki Electric Ind Co Ltd Business form reader
JP4702244B2 (en) * 2006-09-26 2011-06-15 沖電気工業株式会社 Form reader

Also Published As

Publication number Publication date
JP3409992B2 (en) 2003-05-26

Similar Documents

Publication Publication Date Title
US6226402B1 (en) Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
JP2951814B2 (en) Image extraction method
JP3308032B2 (en) Skew correction method, skew angle detection method, skew correction device, and skew angle detection device
US6385338B1 (en) Image processing method and apparatus
EP0389988B1 (en) Detecting line segments and predetermined patterns in an optically scanned document
JPH08293001A (en) Image processing unit and method and optical character recognition unit and method
JP2001297303A (en) Method and device for recognizing document image and computer readable recording medium
EP0266140B1 (en) Optical character recognition by forming and detecting matrices of geographical features
GB2354925A (en) Image filling method, apparatus and computer readable medium for reducing filling process in producing animation
CN111126266B (en) Text processing method, text processing system, equipment and medium
JP3411472B2 (en) Pattern extraction device
JPH07184040A (en) Detection device of region encircled by marker by means of singe optical path scanning for photograph copying machine and its method
US5625710A (en) Character recognition apparatus using modification of a characteristic quantity
JPH0950527A (en) Frame extracting device and rectangle extracting device
JP3409992B2 (en) Black and white reversal area identification device and table recognition device using the device
JPH06208625A (en) Method and device for processing image
JP2022090469A (en) Format defining device, format defining method, and program
JP3476595B2 (en) Image area division method and image binarization method
JP3019897B2 (en) Line segmentation method
KR100516681B1 (en) Enlarging and smoothing textual characters
JPH09128480A (en) Pattern area segmenting system and pattern extraction device
JPH0388085A (en) Optical character reader
JP4409678B2 (en) Ruled line extraction method
JP2003271973A (en) Method and program for image processing
JP2001143076A (en) Image processor

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030304

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080320

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090320

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100320

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100320

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110320

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110320

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120320

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130320

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130320

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140320

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees