JP3380136B2 - Apparatus and method for identifying format of table image - Google Patents

Apparatus and method for identifying format of table image

Info

Publication number
JP3380136B2
JP3380136B2 JP10450597A JP10450597A JP3380136B2 JP 3380136 B2 JP3380136 B2 JP 3380136B2 JP 10450597 A JP10450597 A JP 10450597A JP 10450597 A JP10450597 A JP 10450597A JP 3380136 B2 JP3380136 B2 JP 3380136B2
Authority
JP
Japan
Prior art keywords
format
input image
ruled lines
formats
ruled line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP10450597A
Other languages
Japanese (ja)
Other versions
JPH10302023A (en
Inventor
浩明 武部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP10450597A priority Critical patent/JP3380136B2/en
Publication of JPH10302023A publication Critical patent/JPH10302023A/en
Application granted granted Critical
Publication of JP3380136B2 publication Critical patent/JP3380136B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、文書や図面をスキ
ャナ等の入力装置で画像データに変換し、その画像デー
タを認識する画像認識装置に係り、画像中の罫線構造を
識別するフォーマット識別装置およびその方法に関す
る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an image recognition device for converting a document or drawing into image data by an input device such as a scanner and recognizing the image data, and a format identification device for identifying a ruled line structure in an image. And its method.

【0002】[0002]

【従来の技術】伝票等、罫線によってフォーマットが構
造化された表形式文書は、現在大量に流通しており、表
形式文書のフォーマットを自動的に識別することへの要
求は非常に大きい。フォーマットの自動識別処理におい
ては、あらかじめ、表形式文書のフォーマットの特徴量
を、モデルとして辞書に登録しておく。そして、未知の
表形式文書が入力されたときに、その画像から特徴量を
算出し、辞書のモデルの特徴量とマッチングして、最も
類似するモデルを特定する。
2. Description of the Related Art Currently, a large amount of tabular documents, such as slips, whose format is structured by ruled lines, are in wide circulation, and there is a great demand for automatically identifying the format of tabular documents. In the automatic format identification processing, the feature quantity of the format of the tabular document is registered in the dictionary as a model in advance. Then, when an unknown tabular document is input, the feature amount is calculated from the image and matched with the feature amount of the model of the dictionary to identify the most similar model.

【0003】従来のモデルマッチング手法では、表全体
を正規化した後、各罫線の位置および長さ、または罫線
により四方を囲まれた各矩形セルの中心点の位置を、入
力文書とモデルの間で照らし合わせて、それらが重なり
合うかどうかを判断し、その結果をもとに類似度を算出
していた。ここで、表の正規化とは、表の縦横比が1対
1になるように画像全体を変換する等の調整処理を意味
している。
In the conventional model matching method, after normalizing the entire table, the position and length of each ruled line or the position of the center point of each rectangular cell surrounded by the ruled lines on the four sides is determined between the input document and the model. Then, it was judged whether or not they overlap each other, and the similarity was calculated based on the result. Here, the normalization of the table means an adjustment process such as converting the entire image so that the aspect ratio of the table becomes 1: 1.

【0004】しかし、このモデルマッチングの成否は正
規化処理の成否に大きく依存するため、この手法は、入
力文書の画像のかすれやノイズなどに対してロバストで
あるとは言えなかった。
However, the success or failure of the model matching largely depends on the success or failure of the normalization process, and thus this method cannot be said to be robust against the blur or noise of the image of the input document.

【0005】そこで、入力文書とモデルの間で罫線の位
置および長さを比較する際に、基準となる位置および長
さを適応的に変化させる手法が、本出願人により開発さ
れた。この手法は、先願の「画像から管理情報を抽出す
る管理情報抽出装置および方法」(特願平08−351
346)において、マッチングテーブルを用いたフォー
ム識別処理として記述されている。
Therefore, the present applicant has developed a technique for adaptively changing the reference position and length when comparing the position and length of ruled lines between an input document and a model. This method is based on the prior application “Management Information Extraction Device and Method for Extracting Management Information from Image” (Japanese Patent Application No. 08-351).
346), it is described as a form identification process using a matching table.

【0006】[0006]

【発明が解決しようとする課題】しかしながら、開発さ
れたモデルマッチング手法では、入力文書における罫線
間の相対的な関係を、モデルにおける罫線間の相対的な
関係と比較するために、ある程度の処理時間を要する。
この処理時間は、比較対象のモデルの個数に一次的に比
例するため、モデルの数が増大するにつれて処理時間も
増大するという問題が発生する。そこで、この手法を与
えられたすべてのモデルに適用せずに、適用対象のモデ
ル数を削減することが望まれる。
However, in the developed model matching method, in order to compare the relative relationship between the ruled lines in the input document with the relative relationship between the ruled lines in the model, a certain processing time is required. Requires.
Since this processing time is linearly proportional to the number of models to be compared, there arises a problem that the processing time increases as the number of models increases. Therefore, it is desirable to reduce the number of models to be applied without applying this method to all the given models.

【0007】本発明の課題は、表形式文書のフォーマッ
ト識別において、詳細なモデルマッチングの適用対象と
なるモデルを削減し、処理を高速化するフォーマット識
別装置およびその方法を提供することである。
An object of the present invention is to provide a format identification apparatus and method for reducing the number of models to which detailed model matching is applied in the format identification of a tabular document and accelerating the processing.

【0008】[0008]

【課題を解決するための手段】図1は、本発明の第1お
よび第2の原理によるフォーマット識別装置の構成図で
ある。
FIG. 1 is a block diagram of a format identification device according to the first and second principles of the present invention.

【0009】本発明の第1の原理のフォーマット識別装
置は、格納手段1、比較手段2、および分類手段3を備
え、複数の表のフォーマットを探索して、与えられた表
画像に対応するフォーマットを求める。
The format identification device according to the first principle of the present invention comprises a storage means 1, a comparison means 2 and a classification means 3, searches for formats of a plurality of tables, and formats corresponding to given table images. Ask for.

【0010】格納手段1は、上記複数の表のフォーマッ
トの特徴に関する情報を格納する。比較手段2は、入力
画像から抽出された1つ以上の特徴と上記複数のフォー
マットの1つに含まれる1つ以上の特徴とを比較して、
対応の可能性のある特徴同士の組み合わせを求める。分
類手段3は、上記複数のフォーマットの1つと入力画像
の少なくとも一方の特徴のうち、上記組み合わせに対応
する特徴の個数を求め、その個数に基づいて上記複数の
フォーマットから探索対象を絞り込む。
The storage means 1 stores information regarding the characteristics of the formats of the plurality of tables. The comparing means 2 compares one or more features extracted from the input image with one or more features included in one of the plurality of formats,
Find combinations of features that may correspond. The classifying unit 3 obtains the number of the features corresponding to the combination among the features of at least one of the plurality of formats and the input image, and narrows down the search target from the plurality of formats based on the number.

【0011】入力画像およびフォーマットの特徴とは、
入力画像およびフォーマットの表構造を記述する任意の
情報を表し、例えば、罫線、罫線同士の交点、または罫
線で囲まれた矩形セルを指す。
What are the characteristics of the input image and format?
It represents arbitrary information that describes the input image and the table structure of the format, and indicates, for example, ruled lines, intersections of the ruled lines, or rectangular cells surrounded by the ruled lines.

【0012】比較手段2は、このような特徴に関する大
きさや位置等の特徴量を、入力画像とフォーマットとの
間で比較し、特徴量が類似している特徴同士を対応可能
と判断する。特徴として罫線を用いた場合、例えば、大
きさや位置が類似している罫線同士の組み合わせが、対
応可能な組み合わせとして求められる。
The comparing means 2 compares the feature quantities such as the size and position of the feature between the input image and the format, and determines that the features having similar feature quantities can correspond to each other. When ruled lines are used as a feature, for example, a combination of ruled lines having similar sizes and positions is obtained as a compatible combination.

【0013】分類手段3は、入力画像の特徴と格納手段
1内のフォーマットの特徴の少なくとも一方において、
比較相手のいずれかの特徴と対応可能であると判断され
たものの個数を数える。そして、例えば、その個数が特
徴の総数に対して一定以上の割合になるようなフォーマ
ットを、探索対象として抽出する。
The classifying means 3 has at least one of the characteristics of the input image and the characteristics of the format in the storage means 1,
The number of objects determined to be compatible with any of the characteristics of the comparison partner is counted. Then, for example, a format whose number is a certain ratio or more with respect to the total number of features is extracted as a search target.

【0014】フォーマット識別装置は、こうして抽出さ
れたフォーマット群のみを対象として、さらに詳細なモ
デルマッチングを行い、入力画像に対応するフォーマッ
トを特定する。対応可能と判断された特徴の数を数える
処理にはあまり時間がかからないので、詳細なモデルマ
ッチングの対象となるモデルの数が効率よく削減され、
処理が高速化される。
The format identification device performs more detailed model matching only on the format group thus extracted to specify the format corresponding to the input image. The process of counting the number of features determined to be compatible does not take much time, so the number of models subject to detailed model matching is efficiently reduced,
The processing speed is increased.

【0015】次に、本発明の第2の原理のフォーマット
識別装置は、比較手段2と計算手段4を備え、2つの表
画像をマッチングするために、それらの2つの表画像か
ら抽出されたフォーマットの特徴を比較する。
Next, the format discriminating apparatus according to the second principle of the present invention comprises the comparing means 2 and the calculating means 4, and in order to match the two table images, the format extracted from the two table images. Compare the features of.

【0016】比較手段2は、上記2つの表画像の一方に
含まれる1つ以上の特徴ともう一方に含まれる1つ以上
の特徴とを比較して、対応の可能性のある特徴同士の組
み合わせを求める。計算手段4は、上記2つの表画像の
少なくとも一方の特徴のうち、上記組み合わせに対応す
る特徴の個数を求め、その個数に基づいて上記2つの表
画像の類似度を算出する。
The comparing means 2 compares one or more features included in one of the two table images with one or more features included in the other, and combines features that may be associated with each other. Ask for. The calculating means 4 obtains the number of the features corresponding to the combination among at least one of the features of the two table images, and calculates the degree of similarity between the two table images based on the number.

【0017】比較手段2は、与えられた2つの表画像か
ら抽出された罫線等の特徴を比較して、対応の可能性を
判断し、対応可能な特徴同士の組み合わせを求める。計
算手段4は、それらの表画像の少なくとも一方におい
て、比較相手のいずれかの特徴と対応可能であると判断
されたものの個数を数える。そして、例えば、その個数
が特徴の総数に対して占める割合を計算し、その結果を
2つの表画像の類似度とする。
The comparing means 2 compares the features such as ruled lines extracted from the two given table images, determines the possibility of correspondence, and obtains a combination of features that can be dealt with. The calculating means 4 counts the number of those determined to be able to correspond to any of the characteristics of the comparison partner in at least one of the front images. Then, for example, the ratio of the number to the total number of features is calculated, and the result is used as the degree of similarity between the two table images.

【0018】フォーマット識別装置は、例えば、得られ
た類似度が一定値以上のとき、それらの表画像のフォー
マットが一致するものとみなす。対応可能と判断された
特徴の数を数える処理にはあまり時間がかからないの
で、比較的簡単に類似度を求めることができ、マッチン
グ処理が効率よく行われる。
The format identification device considers that the formats of these front images match each other, for example, when the obtained similarity is a certain value or more. Since the process of counting the number of features determined to be compatible does not take much time, the degree of similarity can be obtained relatively easily, and the matching process can be performed efficiently.

【0019】例えば、図1の格納手段1は、後述する図
2のメモリ12または外部記憶装置15に対応し、比較
手段2、分類手段3、および計算手段4は、CPU(中
央処理装置)11およびメモリ12に対応する。
For example, the storage means 1 of FIG. 1 corresponds to a memory 12 or an external storage device 15 of FIG. 2 described later, and the comparison means 2, the classification means 3 and the calculation means 4 are provided with a CPU (central processing unit) 11 And the memory 12.

【0020】[0020]

【発明の実施の形態】以下、図面を参照しながら、本発
明の実施の形態を詳細に説明する。上述した先願のモデ
ルマッチング処理の場合においても、横罫線と縦罫線の
交点の数などに基づいてあらかじめ辞書内のモデルの大
分類を行い、詳細識別処理を適用すべきモデルの候補を
ある程度の割合で限定している。
BEST MODE FOR CARRYING OUT THE INVENTION Embodiments of the present invention will be described in detail below with reference to the drawings. Even in the case of the model matching process of the prior application described above, the models in the dictionary are roughly classified in advance based on the number of intersections of the horizontal ruled lines and the vertical ruled lines, and the model candidates to which the detailed identification process should be applied to some extent. Limited by percentage.

【0021】本実施形態では、先願で詳細識別処理の一
種として記述されていたモデルマッチングに、新たな大
分類処理を挿入して、モデルの数をさらに削減する。そ
こで、まず先願の詳細識別処理と同様に、表全体に対す
る罫線の相対的な大きさと位置を特徴量として、入力文
書の画像に含まれる罫線とモデルの罫線との対応可能性
を調べ、対応可能な罫線同士の組み合わせを求める。
In the present embodiment, a new large classification process is inserted in the model matching described as a kind of the detailed identification process in the prior application to further reduce the number of models. Therefore, similar to the detailed identification process of the prior application, first, by using the relative size and position of the ruled line with respect to the entire table as the feature amount, the possibility of correspondence between the ruled line included in the image of the input document and the model ruled line is examined, and correspondence is performed. Find possible combinations of ruled lines.

【0022】ここでは、対応可能性の条件を広げてとる
ことで、一本の罫線に対して複数の罫線が対応可能とな
る。したがって、表全体に関する特徴量の抽出に失敗し
たとしても、その失敗がある範囲内であれば、正しい対
応関係を見落とすことはない。
Here, by expanding the condition of the possibility of correspondence, a plurality of ruled lines can correspond to one ruled line. Therefore, even if the extraction of the feature amount for the entire table fails, the correct correspondence is not overlooked if the failure is within a certain range.

【0023】次に、入力画像およびモデルの各罫線につ
いて、対応可能な組み合わせが生成されたものの個数を
調べ、罫線の総数に対する得られた個数の割合を算出す
る。そして、あるしきい値以上の割合を持つモデルを大
分類候補として認定する。このしきい値を適当に設定す
ることで、大分類候補を絞り込むことが可能になる。
Next, with respect to each ruled line of the input image and the model, the number of combinations that can be handled is generated, and the ratio of the obtained number to the total number of ruled lines is calculated. Then, a model having a ratio equal to or higher than a certain threshold is recognized as a large classification candidate. By appropriately setting this threshold value, it is possible to narrow down the large classification candidates.

【0024】本実施形態のフォーマット識別装置は、例
えば図2に示すような情報処理装置(コンピュータ)に
より実現される。図2の情報処理装置は、CPU11、
メモリ12、入力装置13、出力装置14、外部記憶装
置15、媒体駆動装置16、ネットワーク接続装置1
7、および光電変換装置18を備え、それらの各装置は
バス19により互いに結合されている。
The format identification device of this embodiment is realized by an information processing device (computer) as shown in FIG. 2, for example. The information processing apparatus shown in FIG.
Memory 12, input device 13, output device 14, external storage device 15, medium drive device 16, network connection device 1
7 and a photoelectric conversion device 18, which are connected to each other by a bus 19.

【0025】CPU11は、メモリ12を利用しながら
プログラムを実行して、フォーマット識別処理を行う。
メモリ12としては、例えばROM(read only memor
y)、RAM(random access memory)等が用いられ
る。
The CPU 11 executes the program while utilizing the memory 12 to perform the format identification processing.
As the memory 12, for example, a ROM (read only memor)
y), RAM (random access memory), etc. are used.

【0026】入力装置13は、例えばキーボード、ポイ
ンティング・デバイス等に相当し、ユーザからの要求や
指示の入力に用いられる。また、出力装置14は、表示
装置(ディスプレイ)やプリンタ等に相当し、ユーザへ
の問い合せや処理結果等の出力に用いられる。
The input device 13 corresponds to, for example, a keyboard, a pointing device, etc., and is used for inputting requests and instructions from the user. The output device 14 corresponds to a display device (printer), a printer, etc., and is used for inquiring of the user and outputting processing results.

【0027】外部記憶装置15は、例えば、磁気ディス
ク装置、光ディスク装置、光磁気ディスク装置等であ
り、プログラムやデータを保存することができる。ま
た、画像やモデル辞書を保存するデータベースとしても
使用される。
The external storage device 15 is, for example, a magnetic disk device, an optical disk device, a magneto-optical disk device, etc., and can store programs and data. It is also used as a database to store images and model dictionaries.

【0028】媒体駆動装置16は、可搬記憶媒体20を
駆動し、その記憶内容にアクセスする。可搬記憶媒体2
0としては、メモリカード、フロッピーディスク、CD
−ROM(compact disk read only memory )、光ディ
スク、光磁気ディスク等、任意の計算機読み出し可能記
憶媒体を使用することができる。この可搬記憶媒体20
には、データのほかに、上述のフォーマット識別処理を
行うプログラムが格納される。
The medium driving device 16 drives the portable storage medium 20 and accesses the stored contents. Portable storage medium 2
0 means memory card, floppy disk, CD
Any computer-readable storage medium such as a ROM (compact disk read only memory), an optical disk, a magneto-optical disk can be used. This portable storage medium 20
In addition to data, the program stores a program for performing the above-described format identification processing.

【0029】ネットワーク接続装置17は、LAN(lo
cal area network)等の任意の通信ネットワークに接続
され、通信に伴うデータ変換等を行う。フォーマット識
別装置は、ネットワーク接続装置17を介して、外部の
データベース等から必要なデータやプログラムを受け取
ることができる。また、光電変換装置18は、例えばイ
メージ・スキャナであり、処理対象となる文書や図面等
の画像を入力する。
The network connection device 17 is a LAN (lo
It is connected to any communication network such as a cal area network) and performs data conversion accompanying communication. The format identification device can receive necessary data and programs from an external database or the like via the network connection device 17. The photoelectric conversion device 18 is, for example, an image scanner, and inputs an image such as a document or drawing to be processed.

【0030】図3は、本実施形態のフォーマット識別処
理のフローチャートである。処理が開始されると、フォ
ーマット識別装置は、まず、画像を入力し(ステップS
1)、入力された画像から罫線を抽出する(ステップS
2)。
FIG. 3 is a flowchart of the format identification processing of this embodiment. When the processing is started, the format identification device first inputs an image (step S
1) Extract ruled lines from the input image (step S
2).

【0031】そして、その罫線を囲む矩形(罫線矩形)
の左上頂点の座標に関し、横罫線はy座標の小さい順
に、縦罫線はx座標の小さい順に、各罫線を並べ直す
(ステップS3)。ここでは、座標のx軸を横方向にと
り、y軸を縦方向にとっている。横罫線のy座標が同じ
場合は、そのx座標の小さい順にソートし、縦罫線のx
座標が同じ場合は、そのy座標の小さい順にソートす
る。
A rectangle surrounding the ruled line (ruled line rectangle)
Regarding the coordinates of the upper left apex, the horizontal ruled lines are rearranged in the ascending order of the y coordinate, and the vertical ruled lines are arranged in the ascending order of the x coordinate (step S3). Here, the x-axis of the coordinates is in the horizontal direction and the y-axis is in the vertical direction. If the y-coordinates of the horizontal ruled lines are the same, sort them in ascending order of their x-coordinates,
If the coordinates are the same, the y-coordinates are sorted in ascending order.

【0032】次に、縦横各罫線について概略情報を抽出
する(ステップS4)。概略情報とは、表全体に対する
罫線の長さおよび位置の相対的な値であり、3つの整数
の組で表される。また、縦横各方向における2本の罫線
のすべての組み合わせを考え、各組み合わせに関する詳
細情報を抽出する(ステップS5)。詳細情報は、2本
の罫線間の長さおよび位置の相対的な関係を表す。
Next, general information is extracted for each vertical and horizontal ruled line (step S4). The outline information is a relative value of the length and position of the ruled line with respect to the entire table, and is represented by a set of three integers. Further, considering all combinations of two ruled lines in each of the vertical and horizontal directions, detailed information regarding each combination is extracted (step S5). The detailed information represents the relative relationship between the length and the position between the two ruled lines.

【0033】入力画像と照合されるモデルの表画像の概
略情報および詳細情報は、あらかじめ抽出されて辞書2
1に格納されている。そこで、次に、入力画像の概略情
報および詳細情報と、モデルの概略情報および詳細情報
とを照合し、モデルマッチングを行う(ステップS
6)。ここで、概略情報は大分類モデルマッチングに用
いられ、詳細情報は詳細分類モデルマッチングに用いら
れる。そして、最適なモデルを識別結果として出力し
(ステップS7)、処理を終了する。
The outline information and the detailed information of the front image of the model to be collated with the input image are extracted in advance and stored in the dictionary 2.
It is stored in 1. Therefore, next, the outline information and the detailed information of the input image are collated with the outline information and the detailed information of the model to perform model matching (step S).
6). Here, the outline information is used for large classification model matching, and the detailed information is used for detailed classification model matching. Then, the optimum model is output as the identification result (step S7), and the process ends.

【0034】次に、図4から図10までを参照しなが
ら、ステップS4、S5、およびS6の処理について詳
細に説明する。以下では、概略情報のことを大域情報と
呼ぶことにする。
Next, the processes of steps S4, S5 and S6 will be described in detail with reference to FIGS. Hereinafter, the outline information will be referred to as global information.

【0035】ステップS4においては、大域情報を求め
るための前処理として、表の基準幅W、基準高H、基準
x座標x0、および基準y座標y0を求める。まず、横
罫線に関してそれらの最大長を求め、その長さに比べて
あるしきい値以上の割合(例えば0.8)の長さを持つ
横罫線のうち、順位が最初のものと最後のものとを求
め、それらを外郭基準横罫線とする。
In step S4, the reference width W, the reference height H, the reference x coordinate x0, and the reference y coordinate y0 of the table are obtained as preprocessing for obtaining the global information. First, the maximum lengths of horizontal ruled lines are calculated, and the first and last horizontal ruled lines having a length greater than a certain threshold (for example, 0.8) relative to that length. , And use them as the outer standard horizontal ruled lines.

【0036】縦罫線に関しても最大長を求め、横罫線の
場合と同様にして、2本の外郭基準縦罫線を得る。そこ
で、得られた4本の外郭基準罫線の外接矩形を考え、そ
の幅を基準幅W、その高さを基準高H、その左上頂点を
基準点とし、その座標を基準座標(x0,y0)とす
る。
Regarding the vertical ruled lines, the maximum length is obtained, and two outer reference vertical ruled lines are obtained in the same manner as in the case of the horizontal ruled lines. Then, consider the circumscribed rectangle of the obtained four outline reference ruled lines, its width is the reference width W, its height is the reference height H, and its upper left apex is the reference point, and its coordinates are the reference coordinates (x0, y0). And

【0037】例えば、図4のような表形式文書において
は、横罫線31、32が外郭基準横罫線として抽出さ
れ、縦罫線33、34が外郭基準縦罫線として抽出さ
れ、これらの外郭基準罫線の外接矩形の幅が基準幅Wと
なり、その高さが基準高Hとなる。また、その外接矩形
の左上頂点35の座標が基準座標(x0,y0)とな
る。
For example, in the tabular document as shown in FIG. 4, the horizontal ruled lines 31 and 32 are extracted as the outer reference horizontal ruled lines, and the vertical ruled lines 33 and 34 are extracted as the outer reference vertical ruled lines. The width of the circumscribed rectangle is the reference width W, and its height is the reference height H. Further, the coordinates of the upper left apex 35 of the circumscribed rectangle are the reference coordinates (x0, y0).

【0038】ここで、最大長から算出される一定長さ以
上の罫線の中から外郭基準罫線を選ぶことで、例えば、
横罫線36、37のような短い罫線が外郭基準罫線の候
補から除外される。4本の外郭基準罫線の外接矩形の左
上頂点を基準点とする代わりに、左下頂点、右上頂点、
右下頂点等、外接矩形の周辺上の任意の点を基準点とす
ることもできる。その場合でも、以下の処理は基本的に
同様である。
Here, by selecting the outline reference ruled line from ruled lines having a predetermined length or more calculated from the maximum length, for example,
Short ruled lines such as the horizontal ruled lines 36 and 37 are excluded from the candidates for the outer reference ruled lines. Instead of using the upper left vertex of the circumscribed rectangle of the four outline reference ruled lines as the reference point, the lower left vertex, the upper right vertex,
An arbitrary point on the periphery of the circumscribed rectangle, such as the lower right apex, can be used as the reference point. Even in that case, the following processing is basically the same.

【0039】次に、得られた表の大きさと基準座標をも
とにして、各罫線矩形の長さと中心位置の情報から、3
つの特徴量(大域情報)length1、twist、
positionを求める。横罫線の場合、図5に示す
ように、罫線矩形41の長さl1と中心座標(x1,y
1)から、次式によりこれらの特徴量を算出する。 length1=[(l1/W)×100]の整数部分 twist=[((x1−x0)/W)×100]の整数部分 (1) position=[((y1−y0)/H)×100]の整数部分 また、縦罫線の場合、図6に示すように、罫線矩形42
の長さl1と中心座標(x1,y1)から、次式により
これらの特徴量を算出する。 length1=[(l1/H)×100]の整数部分 twist=[((y1−y0)/H)×100]の整数部分 (2) position=[((x1−x0)/W)×100]の整数部分 得られた特徴量のうち、length1は表のサイズに
対する罫線の長さの相対的な割合を表し、twistと
positionは、表の基準点に対する罫線の相対的
な位置を表している。
Next, based on the size of the obtained table and the reference coordinates, from the information of the length and center position of each ruled line rectangle, 3
Two feature quantities (global information) length1, twist,
Request the position. In the case of a horizontal ruled line, as shown in FIG. 5, the length l1 of the ruled line rectangle 41 and the center coordinates (x1, y
From 1), these feature quantities are calculated by the following equation. length1 = integer part of [(l1 / W) × 100] twist = [((x1-x0) / W) × 100] integer part (1) position = [((y1-y0) / H) × 100] In the case of vertical ruled lines, as shown in FIG.
From the length l1 and the center coordinates (x1, y1), these feature quantities are calculated by the following equation. length1 = integer part of [(l1 / H) × 100] twist = [((y1-y0) / H) × 100] integer part (2) position = [((x1-x0) / W) × 100] In the obtained integer, the length1 represents the relative ratio of the length of the ruled line to the size of the table, and the twist and the position represent the relative position of the ruled line to the reference point of the table.

【0040】次に、ステップS5においては、2本の罫
線の相対的な関係を表す詳細情報を求める。ここでは、
一方の罫線矩形の長さを1としたときの、もう一方の罫
線矩形の長さlength2、それぞれの罫線矩形の中
心間のx方向のずれの長さdiffer、および中心間
のy方向のずれの長さheightの3つの値を、詳細
情報として求めることにする。
Next, in step S5, detailed information indicating the relative relationship between the two ruled lines is obtained. here,
When the length of one ruled line rectangle is 1, the length length2 of the other ruled line rectangle, the length difference in the x direction between the centers of the respective ruled line rectangles, and the difference in the y direction between the centers Three values of the length height will be obtained as detailed information.

【0041】まず、2本の横罫線のすべての組み合わせ
を抽出する。そして、各組み合わせにおいて、図7に示
すように、一方の罫線矩形(ソート順位の早い方)43
の長さをl1、その中心座標を(x1,y1)、もう一
方の罫線矩形(ソート順位の遅い方)44の長さをl
2、その中心座標を(x2,y2)とする。このとき、
罫線矩形43の中心を基準として、これらの罫線矩形の
中心間のx方向のずれdwとy方向のずれをdhを次式
により定義する。 dw=x2−x1 dh=y2−y1 (3) この定義によれば、罫線矩形44の中心が罫線矩形43
の中心より右にあれば、dwは正となり、罫線矩形44
の中心が罫線矩形43の中心より左にあれば、dwは負
となる。同様に、罫線矩形44の中心が罫線矩形43の
中心より下にあれば、dhは正となり、罫線矩形44の
中心が罫線矩形43の中心より上にあれば、dhは負と
なる。
First, all combinations of two horizontal ruled lines are extracted. Then, in each combination, as shown in FIG. 7, one ruled line rectangle (the one having the earlier sort order) 43
Is l1, the center coordinate is (x1, y1), and the length of the other ruled line rectangle (the one with the slower sorting order) 44 is l
2 and its center coordinates are (x2, y2). At this time,
With the center of the ruled line rectangle 43 as a reference, a shift dw in the x direction and a shift in the y direction between the centers of these ruled line rectangles are defined by the following equation. dw = x2-x1 dh = y2-y1 (3) According to this definition, the center of the ruled line rectangle 44 is the ruled line rectangle 43.
If it is to the right of the center of, the dw becomes positive and the ruled line rectangle 44
If the center of is to the left of the center of the ruled line rectangle 43, dw is negative. Similarly, if the center of the ruled line rectangle 44 is below the center of the ruled line rectangle 43, dh is positive, and if the center of the ruled line rectangle 44 is above the center of the ruled line rectangle 43, dh is negative.

【0042】次に、上述の3つの特徴量length
2、differ、heightを、次式により算出す
る。 length2=12/l1 differ=dw/l1 (4) height=dh/l1 また、縦罫線についても同様に、2本の罫線のすべての
組み合わせを抽出する。そして、各組み合わせにおい
て、図8に示すように、ソート順位の早い方の罫線矩形
45の長さをl1、その中心座標を(x1,y1)、ソ
ート順位の遅い方の罫線矩形46の長さをl2、その中
心座標を(x2,y2)とする。そして、(3)式によ
りdwとdhを求め、次式により、詳細情報lengt
h2、differ、heightを算出する。 length2=12/l1 differ=dh/l1 (5) height=dw/l1 (5)式においては、differとheightの定
義が、(4)式と逆になっている。
Next, the above-mentioned three feature quantities length
2, differ and height are calculated by the following equation. length2 = 12 / l1 differ = dw / l1 (4) height = dh / l1 Similarly, for vertical ruled lines, all combinations of two ruled lines are extracted. In each combination, as shown in FIG. 8, the length of the ruled line rectangle 45 having the earlier sort order is l1, its center coordinates are (x1, y1), and the length of the ruled line rectangle 46 having the slower sort order is Is 12 and its center coordinates are (x2, y2). Then, dw and dh are obtained by the equation (3), and the detailed information length is obtained by the following equation.
Calculate h2, differ, and height. length2 = 12 / l1 differ = dh / l1 (5) weight = dw / l1 In the formula (5), the definitions of differ and height are opposite to those of the formula (4).

【0043】次に、ステップS6において、横罫線同士
と縦罫線同士の2回に分けて、入力画像の大域情報およ
び詳細情報を、各モデルの大域情報および詳細情報と照
合し、フォーマットの類似度を計算する。本発明の大分
類処理は、このステップS6のモデルマッチングに含ま
れており、これをより詳細に示したフローチャートが図
9である。以下、モデルマッチングを図9のフローチャ
ートに従って説明する。
Next, in step S6, the horizontal and vertical ruled lines are divided into two, and the global information and detailed information of the input image are compared with the global information and detailed information of each model to determine the degree of format similarity. To calculate. The large classification processing of the present invention is included in the model matching in step S6, and a flowchart showing this in more detail is shown in FIG. The model matching will be described below with reference to the flowchart of FIG.

【0044】フォーマット識別装置は、まず、大分類候
補の数を決定する(ステップS11)。辞書21内のモ
デルの数をnとするとき、大分類候補の数candは、
次式により決められる。 cand=max{n/10,inf} (6) ここで、infは、あらかじめユーザから与えられた候
補数の最低限度を表し、例えばinf=50とする。
(6)式の右辺は、n/10とinfの最大値を表す。
The format identification device first determines the number of large classification candidates (step S11). When the number of models in the dictionary 21 is n, the number of major classification candidates cand is
It is determined by the following formula. cand = max {n / 10, inf} (6) Here, inf represents the minimum number of candidates given in advance by the user, and for example, inf = 50.
The right side of the equation (6) represents the maximum value of n / 10 and inf.

【0045】次に、大分類モデルマッチングを行い、入
力画像の大域情報を各モデルの大域情報と照合する(ス
テップS12)。この大分類モデルマッチングは、各モ
デルについて、横罫線および縦罫線の2回に分けて行わ
れる。大分類モデルマッチングにおいては、まず、未知
文書の入力画像の横罫線の数をp本、モデルの横罫線の
数をm本として、図10に示すようなp×mの表が作成
される。
Next, the large classification model matching is performed to compare the global information of the input image with the global information of each model (step S12). This large classification model matching is performed twice for each model, that is, horizontal ruled lines and vertical ruled lines. In the large-class model matching, first, a p × m table as shown in FIG. 10 is created with the number of horizontal ruled lines of the input image of the unknown document being p and the number of horizontal ruled lines of the model being m.

【0046】ここでは、p=12、m=15であり、表
の行番号および列番号は、ともに0から始まっている。
この表のi行j列の要素(項目)は、入力画像のi番目
の罫線とモデルのj番目の罫線の対応関係を表すデータ
である。以下では、このような表をマッチングテーブル
と呼ぶことにする。
Here, p = 12 and m = 15, and both the row number and the column number of the table start from 0.
The element (item) at the i-th row and the j-th column in this table is data representing the correspondence between the i-th ruled line of the input image and the j-th ruled line of the model. Hereinafter, such a table will be referred to as a matching table.

【0047】次に、大域情報に基づいて、入力画像のi
番目の横罫線IP(i)が、モデルのj番目の横罫線M
O(j)に対応するかどうかの可能性を判断し、対応す
る可能性があれば、マッチングテーブルのi行j列の要
素にノードを配置する。これにより、横罫線IP(i)
と横罫線MO(j)の組み合わせが、罫線対応候補とし
てマッチングテーブル上に記述される。このときの対応
可能性の条件は十分緩くとっておき、一つの罫線に対し
て、複数の罫線が重複して対応することを許すものとす
る。
Next, based on the global information, the i of the input image is
The th horizontal ruled line IP (i) is the jth horizontal ruled line M of the model.
Whether or not it corresponds to O (j) is determined, and if there is a possibility of correspondence, a node is arranged in the element at the i-th row and the j-th column of the matching table. As a result, the horizontal ruled line IP (i)
And the horizontal ruled line MO (j) are described on the matching table as ruled line correspondence candidates. The condition of the possibility of correspondence at this time is set to be sufficiently loose to allow a plurality of ruled lines to correspond to one ruled line in an overlapping manner.

【0048】ここでは、罫線IP(i)の大域情報(l
ength1,twist,position)をそれ
ぞれ(ipl,ipt,ipp)とおき、罫線MO
(j)の大域情報をそれぞれ(mol,mot,mo
p)とおいて、各値の差が一定値より小さいとき、罫線
IP(i)と罫線MO(j)が対応する可能性があると
みなす。
Here, the global information of the ruled line IP (i) (l
(length1, twist, position) are respectively set to (ipl, ipt, ipp), and the ruled line MO is set.
The global information of (j) is (mol, mot, mo)
In p), when the difference between the respective values is smaller than a certain value, it is considered that the ruled line IP (i) and the ruled line MO (j) may correspond to each other.

【0049】可能性を表す具体的な条件は、表内の横罫
線および縦罫線の数に依存したパラメータα、β、γを
しきい値として、次式により与えられる。 |ipl−mol|<α |ipt−mot|<β (7) |ipp−mop|<γ これらの罫線の数に依存したパラメータα、β、γは正
の整数で、罫線数が少ないほど大きな値をとり、逆に罫
線数が多いほど小さな値をとるように定められる。この
とき、(7)式の条件は、表内の罫線の密度が疎であれ
ばマッチングの探索範囲を広げ、密度が密であれば探索
範囲を狭めるという効果を持つ。縦罫線のマッチングテ
ーブルも同様にして作成される。
A concrete condition representing the possibility is given by the following equation with the parameters α, β and γ depending on the number of horizontal ruled lines and vertical ruled lines in the table as threshold values. | Ipl-mol | <α | ipt-mot | <β (7) | ipp-mop | <γ The parameters α, β, and γ that depend on the number of these ruled lines are positive integers, and the smaller the number of ruled lines, the larger. It takes a value, and conversely, the larger the number of ruled lines, the smaller the value. At this time, the condition of Expression (7) has the effect of expanding the matching search range if the density of the ruled lines in the table is sparse, and narrowing the search range if the density is high. A vertical ruled line matching table is also created in the same manner.

【0050】次に、ノードの配置されたマッチングテー
ブルにおいて、横方向および縦方向に関してノードの射
影をとり、大域類似度を算出する。ここでは、入力画像
およびモデルの横罫線について、ノードが存在する行お
よび列に対応する罫線の個数を調べ、それらの個数をそ
れぞれiphit、mohitとする。そして、横罫線
の総数に対する各個数の割合を算出し、次式に示すよう
に、それらの和を横罫線の大域類似度とする。 横罫線の大域類似度=iphit/p+mohit/m (8) 例えば、図10のマッチングテーブルにおいては、記号
●で表された1つ以上のノードが存在する行および列
が、記号★により示されている。これらの記号★の数を
数えてみると、iphit=8、mohit=10であ
ることが分かる。そこで、(8)式の大域類似度は、8
/12+10/15=1.33となる。縦罫線の大域類
似度も同様にして算出され、1つのモデルの大域類似度
は、横罫線の大域類似度と縦罫線の大域類似度の和で与
えられる。
Next, in the matching table in which the nodes are arranged, the projection of the nodes is taken in the horizontal direction and the vertical direction, and the global similarity is calculated. Here, regarding the horizontal ruled lines of the input image and the model, the number of ruled lines corresponding to the row and the column in which the node exists is determined, and these numbers are set as iphit and mohit, respectively. Then, the ratio of each number to the total number of horizontal ruled lines is calculated, and the sum thereof is taken as the global similarity of the horizontal ruled lines, as shown in the following expression. Global similarity of horizontal ruled line = iphit / p + mohit / m (8) For example, in the matching table of FIG. 10, a row and a column in which one or more nodes represented by the symbol ● exist are indicated by the symbol ★. There is. By counting the numbers of these symbols, it can be seen that ipit = 8 and mohit = 10. Therefore, the global similarity of equation (8) is 8
/12+10/15=1.33. The global similarity of the vertical ruled lines is calculated in the same manner, and the global similarity of one model is given by the sum of the global similarity of the horizontal ruled lines and the global similarity of the vertical ruled lines.

【0051】次に、大域類似度があるしきい値以上のモ
デル、あるいは大域類似度が上位cand位までのモデ
ルを、大分類候補とする(ステップS13)。あるいは
また、大域類似度がしきい値以上のモデルのうち上位c
and位までのものを大分類候補としてもよい。
Next, a model whose global similarity is equal to or higher than a certain threshold value or a model whose global similarity is up to the top cand is set as a large classification candidate (step S13). Alternatively, among the models whose global similarity is equal to or higher than the threshold value, the top c
The ones up to the and position may be the major classification candidates.

【0052】次に、大分類候補のモデルに対して先願に
記述された処理を適用して、詳細分類モデルマッチング
を行い、詳細類似度を算出する(ステップS14)。そ
して、得られた詳細類似度に基づいて入力画像に対応す
る表のフォーマットを決定し(ステップS15)、処理
を終了する。
Next, the detailed classification model matching is performed by applying the processing described in the prior application to the model of the large classification candidate, and the detailed similarity is calculated (step S14). Then, the format of the table corresponding to the input image is determined based on the obtained detailed similarity (step S15), and the process ends.

【0053】本実施形態においては、ステップS13で
用いられるしきい値およびcandの値を適当に調整す
ることで、大分類候補の数を効果的に削減することがで
き、詳細分類モデルマッチングを高速化することができ
る。
In this embodiment, by appropriately adjusting the threshold value and the value of cand used in step S13, the number of large classification candidates can be effectively reduced, and the detailed classification model matching can be performed at high speed. Can be converted.

【0054】また、ステップS12において(7)式の
各しきい値を大きめに設定すれば、罫線同士の対応可能
性の条件が緩くなる。したがって、かすれやノイズなど
の影響で罫線抽出がうまくいかない部分があっても、入
力文書に類似したモデルをもれなく大分類候補に含める
ことができる。このため、詳細分類モデルマッチングの
対象を、辞書21内のすべてのモデルのうち、入力文書
と同じ罫線構造のモデルを含んだ大分類候補群に限定す
ることができる。
Further, if the threshold values of the equation (7) are set to be large in step S12, the condition of the possibility of correspondence between the ruled lines becomes loose. Therefore, even if there is a portion where ruled line extraction does not work well due to the effect of blurring or noise, a model similar to the input document can be included in the major classification candidates without exception. Therefore, the target of the detailed classification model matching can be limited to the large classification candidate group including the model having the same ruled line structure as the input document among all the models in the dictionary 21.

【0055】次に、図11から図15までを参照しなが
ら、図9のステップS12における大分類モデルマッチ
ングの処理を詳細に説明する。図11、12、13、1
4は、1つのマッチングテーブルに対して行われる大分
類モデルマッチングの一例を示すフローチャートであ
る。
Next, the processing of the large classification model matching in step S12 of FIG. 9 will be described in detail with reference to FIGS. 11, 12, 13, 1
4 is a flowchart showing an example of the large classification model matching performed for one matching table.

【0056】このうち、図11、12は、マッチングテ
ーブルに図15に示すようなウィンドウ51を設定する
処理を表す。このウィンドウ51は、マッチングテーブ
ルのj番目の列内で、ノードが配置される可能性のある
領域を表し、その最上端の行番号はst[j]と記述さ
れ、その最下端の行番号はed[j]と記述される。ま
た、図13、14は、配置されるノードの数を数える処
理を表す。
Of these, FIGS. 11 and 12 show the process of setting the window 51 as shown in FIG. 15 in the matching table. This window 51 represents a region in which a node may be arranged in the j-th column of the matching table. The line number at the top end is described as st [j] and the line number at the bottom end is It is described as ed [j]. 13 and 14 show a process of counting the number of arranged nodes.

【0057】処理が開始されると、フォーマット識別装
置は、まず、マッチングテーブルの列を表す制御変数j
を0とおき(ステップS21)、モデルのj番目の罫線
をmoとする(ステップS22)。次に、大域情報po
sitionがモデルのj番目の罫線と類似しているよ
うな未知文書の罫線の数を表す変数kを0とおく(ステ
ップS23)。
When the process is started, the format identification device firstly controls the control variable j representing the row of the matching table.
Is set to 0 (step S21), and the j-th ruled line of the model is set to mo (step S22). Next, global information po
A variable k representing the number of ruled lines of an unknown document whose position is similar to the j-th ruled line of the model is set to 0 (step S23).

【0058】次に、マッチングテーブルの行を表す制御
変数iを0とおいて(ステップS24)、入力文書のi
番目の罫線をipとする(ステップS25)。そして、
大域情報ippとmopの差の絶対値|ipp−mop
|を、しきい値γと比較する(ステップS26)。
Next, the control variable i representing the row of the matching table is set to 0 (step S24), and i of the input document is set.
The th ruled line is set to ip (step S25). And
Absolute value of difference between global information ipp and mop | ipp-mop
| Is compared with the threshold value γ (step S26).

【0059】|ipp−mop|がγより小さければ、
次に、図12の処理を行ってウィンドウ51を設定す
る。ここでは、まず、kを0と比較し(ステップS3
5)、kが0であれば、st[j]=iとおいて、kに
1を加算する(ステップS37)。kが0でなければ、
st[j]はすでに設定されているので、そのままステ
ップS37の処理を行う。
If | ipp-mop | is smaller than γ,
Next, the window 51 is set by performing the processing of FIG. Here, first, k is compared with 0 (step S3
5) If k is 0, st [j] = i is set and 1 is added to k (step S37). If k is not 0,
Since st [j] has already been set, the process of step S37 is performed as it is.

【0060】次に、未知文書の罫線数をipsuuとし
て、iをipsuu−1と比較する(ステップS3
8)。このipsuuは、マッチングテーブルの行数に
対応しており、ipsuu−1は、マッチングテーブル
の最終行の番号を表す。
Next, the number of ruled lines of the unknown document is set to ipsuu, and i is compared with ipsuu-1 (step S3).
8). This ipsu corresponds to the number of rows in the matching table, and ipsu-1 represents the number of the last row in the matching table.

【0061】iがipsuu−1に達していれば、ed
[j]=iとおいて(ステップS39)、jに1を加算
し(図11、ステップS33)、jをモデルの罫線数m
osuuと比較する(ステップS34)。そして、jが
mosuuより小さければ、ステップS22以降の処理
を繰り返す。
If i reaches ipsu-1, then ed
Setting [j] = i (step S39), 1 is added to j (FIG. 11, step S33), and j is the number m of ruled lines in the model.
It is compared with osuu (step S34). Then, if j is smaller than mosuu, the processing from step S22 is repeated.

【0062】図12のステップS38において、iがi
psuu−1より小さければ、iに1を加算して(図1
1、ステップS28)、iをipsuuと比較する(ス
テップS29)。そして、iがipsuuより小さけれ
ば、ステップS25以降の処理を繰り返し、iがips
uuに達すると、再びkを0と比較する(ステップS3
0)。
In step S38 of FIG. 12, i is i
If it is smaller than psu-1, add 1 to i (see FIG.
1, step S28), i is compared with ipsu (step S29). If i is smaller than ipsuu, the processing from step S25 is repeated until i is ips
When uu is reached, k is again compared with 0 (step S3).
0).

【0063】kが0のままであれば、大域情報posi
tionがモデルのj番目の罫線と類似している未知文
書の罫線が存在しなかったことになる。そこで、st
[j]=ed[j]=−1とおき(ステップS31)、
ステップS33以降の処理を行う。st[j]、ed
[j]が−1のとき、ウィンドウ51は設定されない。
If k remains 0, the global information posi
It means that there is no ruled line of the unknown document whose tion is similar to the j-th ruled line of the model. Then st
[J] = ed [j] = − 1 (step S31),
The processing after step S33 is performed. st [j], ed
When [j] is -1, the window 51 is not set.

【0064】また、ステップS26において、|ipp
−mop|がγ以上であれば、次に、kを0と比較する
(ステップS27)。そして、kが0であれば、まだs
t[j]が設定されていないので、ステップS28以降
の処理を行う。kが0より大きければ、すでにst
[j]はいずれかの行に設定されているので、次に、e
d[j]=i−1とおいて、ステップS33以降の処理
を行う。
In step S26, | ipp
If −mop | is γ or more, then k is compared with 0 (step S27). And if k is 0, then s
Since t [j] is not set, the processing from step S28 is performed. If k is greater than 0, already st
Since [j] is set in any row, next, e
With d [j] = i−1, the processing from step S33 is performed.

【0065】さらに、ステップS30において、kが0
より大きければ、すでにst[j]、ed[j]は設定
されているので、ステップS33以降の処理を行う。ス
テップS34において、jがmosuuに達すれば、マ
ッチングテーブルのすべての列について可能なウィンド
ウ51が設定されたことになるので、次に、ノードの配
置処理を行う。
Further, in step S30, k is 0.
If it is larger, st [j] and ed [j] have already been set, and therefore the processing from step S33 is performed. If j reaches mosuu in step S34, it means that the possible windows 51 have been set for all the columns of the matching table. Therefore, node placement processing is performed next.

【0066】ここでは、まず、ノードが配置される行の
数を表す変数iphitとノードが配置される列の数を
表す変数mohitを0とおき(図13、ステップS4
0)、i番目の行のノード数を表すipline[i]
とj番目の列のノード数を表すmoline[j]を0
とおく(ステップS41)。ただし、i=0,
1,...,ipsuu−1、j=0,1,...,m
osuu−1とする。
Here, first, a variable ipit representing the number of rows in which the nodes are arranged and a variable mohit representing the number of columns in which the nodes are arranged are set to 0 (FIG. 13, step S4).
0), ipline [i] representing the number of nodes in the i-th row
And 0 for moline [j] representing the number of nodes in the jth column
(Step S41). However, i = 0,
1 ,. . . , Ipsu-1, j = 0, 1 ,. . . , M
osuu-1.

【0067】次に、マッチングテーブルの列を表す制御
変数jを0とおき(ステップS42)、モデルのj番目
の罫線をmoとする(ステップS43)。また、マッチ
ングテーブルの行を表す制御変数kをst[j]とおき
(ステップS44)、その値を調べる(ステップS4
5)。
Next, the control variable j representing the column of the matching table is set to 0 (step S42), and the j-th ruled line of the model is set to mo (step S43). Further, the control variable k representing the row of the matching table is set to st [j] (step S44), and its value is checked (step S4).
5).

【0068】kが0以上であれば、j番目の列にはウィ
ンドウ51が設定されているので、入力文書のk番目の
罫線をipとして(ステップS46)、大域情報ipl
とmolの差の絶対値|ipl−mol|をしきい値α
と比較し、大域情報iptとmotの差の絶対値|ip
t−mot|をしきい値βと比較する(ステップS4
7)。
If k is 0 or more, since the window 51 is set in the jth column, the kth ruled line of the input document is set to ip (step S46), and the global information ipl is set.
Absolute value | ipl-mol |
And the absolute value of the difference between the global information ipt and mot | ip
t-mot | is compared with the threshold value β (step S4).
7).

【0069】|ipl−mol|がαより小さく、か
つ、|ipt−mot|がβより小さければ、設定され
たウィンドウ51内の第k行の位置がノード配置の条件
を満たすことになる。そこで、次に、ipline
[k]と0を比較し(図14、ステップS53)、ip
line[k]=0であれば、第k行にノードが存在す
ることを示すために、iphitに1を加算する(ステ
ップS54)。
If | ipl-mol | is smaller than α and | ipt-mot | is smaller than β, the position of the k-th row in the set window 51 satisfies the node arrangement condition. So, next, ipline
[K] is compared with 0 (FIG. 14, step S53), and ip
If line [k] = 0, 1 is added to iphit to indicate that a node exists in the kth row (step S54).

【0070】次に、moline[j]と0を比較し
(ステップS55)、moline[j]=0であれ
ば、第j列にノードが存在することを示すために、mo
hitに1を加算する(ステップS56)。そして、i
pline[k]およびmoline[j]にそれぞれ
1を加算し(ステップS57、S58)、次の行を調べ
るためにkに1を加算して(図13、ステップS4
8)、kをed[j]と比較する(ステップS49)。
Next, 0 is compared with moline [j] (step S55), and if moline [j] = 0, mo is shown to indicate that a node exists in the j-th column.
1 is added to hit (step S56). And i
1 is added to each of plane [k] and moline [j] (steps S57 and S58), and 1 is added to k to check the next row (FIG. 13, step S4).
8), k is compared with ed [j] (step S49).

【0071】ステップS53において、ipline
[k]>0であれば、第k行をすでにカウントしている
ので、ノードステップS55以降の処理を行う。同様
に、ステップS55において、moline[j]>0
であれば、第j列をすでにカウントしているので、ステ
ップS57以降の処理を行う。
In step S53, ipline
If [k]> 0, the k-th row has already been counted, and therefore the processing from node step S55 is performed. Similarly, in step S55, moline [j]> 0
If so, since the j-th column has already been counted, the processing from step S57 is performed.

【0072】ステップS49において、kがed[j]
以下であれば、ステップS46以降の処理を繰り返す。
そして、kがed[j]を越えると、次の列を調べるた
めに、jに1を加算して(ステップS50)、jをmo
suuと比較する(ステップS51)。
In step S49, k is ed [j]
If the following is true, the processing from step S46 is repeated.
When k exceeds ed [j], 1 is added to j in order to check the next column (step S50), and j is mo.
It is compared with Suu (step S51).

【0073】jがmosuuより小さければ、ステップ
S43以降の処理を繰り返し、jがmosuuに達する
と、iphit、mohit、ipline[k]、お
よびmoline[j]のインクリメントを終了する。
この時点で、iphitには、(7)式の条件を満たす
要素が1つ以上存在する行の総数が記録され、mohi
tには、その条件を満たす要素が1つ以上存在する列の
総数が記録されている。
If j is smaller than mosuu, the processing from step S43 is repeated. When j reaches mosuu, the increment of iphit, mohit, ipline [k], and moline [j] is completed.
At this point, the total number of rows in which at least one element satisfying the condition of Expression (7) exists is recorded in ipit, and
In t, the total number of columns in which at least one element satisfying the condition exists is recorded.

【0074】そこで、(8)式と同様の次式により、入
力文書とモデルの大域類似度を算出して(ステップS5
2)、処理を終了する。 大域類似度=iphit/ipsuu+mohit/mosuu (9) (9)式の大域類似度を横罫線と縦罫線のそれぞれのマ
ッチングテーブルについて求め、それらの和をとること
で、最終的な大域類似度が得られる。
Therefore, the global similarity between the input document and the model is calculated by the following equation similar to the equation (8) (step S5).
2), the process ends. Global similarity = iphit / ipsuu + mohit / mosuu (9) The global similarity of Eq. (9) is obtained for each matching table of horizontal ruled lines and vertical ruled lines, and the sum is calculated to obtain the final global similarity. To be

【0075】次に、図16は、図9のステップS13に
おける大分類候補決定処理の一例を示すフローチャート
である。この処理は、上述の大域類似度を用いて行われ
る。処理が開始されると、フォーマット識別装置は、ま
ず、すべてのモデルの集合をSmoとおき(ステップS6
1)、Smoの要素を指す制御変数iを1とおいて(ステ
ップS62)、i番目のモデルの大域類似度をしきい値
THと比較する(ステップS63)。
Next, FIG. 16 is a flow chart showing an example of the large classification candidate determination processing in step S13 of FIG. This processing is performed using the above-mentioned global similarity. When the processing is started, the format identification device first sets a set of all models as Smo (step S6).
1), the control variable i indicating the element of Smo is set to 1 (step S62), and the global similarity of the i-th model is compared with the threshold value TH (step S63).

【0076】大域類似度がTHより小さければ、i番目
のモデルをSmoから除き(ステップS64)、iに1を
加算して(ステップS65)、iをモデルの総数nと比
較する(ステップS66)。そして、iがn以下であれ
ば、ステップS63以降の処理を繰り返す。また、ステ
ップS63において、大域類似度がTH以上であれば、
そのままステップS65以降の処理を行う。
If the global similarity is smaller than TH, the i-th model is removed from Smo (step S64), 1 is added to i (step S65), and i is compared with the total number n of models (step S66). . If i is equal to or less than n, the processing from step S63 is repeated. If the global similarity is equal to or higher than TH in step S63,
The processing from step S65 onward is performed as it is.

【0077】ステップS66において、iがnを越える
と、次に、Smoの要素数を、図9のステップS11で決
められた大分類候補の数candと比較する(ステップ
S67)。
When i exceeds n in step S66, the number of elements of Smo is then compared with the number cand of the large classification candidates determined in step S11 of FIG. 9 (step S67).

【0078】Smoの要素数がcandより大きければ、
Smoの要素を大域類似度の順に整列し直し(ステップS
68)、上位cand個の要素のみをSmoとして(ステ
ップS69)、処理を終了する。また、Smoの要素数が
cand以下であれば、そのまま処理を終了する。
If the number of elements of Smo is larger than cand,
The elements of Smo are rearranged in the order of global similarity (step S
68), only the upper cand elements are set as Smo (step S69), and the process is ended. If the number of elements of Smo is equal to or less than cand, the process is terminated as it is.

【0079】こうして、大分類候補の集合Smoが得られ
ると、Smoに含まれる各モデルに対して、図9のステッ
プS14における詳細分類モデルマッチングが行われ
る。図17は、この詳細分類モデルマッチングのフロー
チャートである。処理が開始されると、フォーマット識
別装置は、まず、大分類モデルマッチングの場合と同様
にして、図10に示したようなマッチングテーブルを作
成する(ステップS71)。
In this way, when the set Smo of large classification candidates is obtained, the detailed classification model matching in step S14 of FIG. 9 is performed on each model included in Smo. FIG. 17 is a flowchart of this detailed classification model matching. When the process is started, the format identification device first creates a matching table as shown in FIG. 10 as in the case of the large classification model matching (step S71).

【0080】次に、大域情報に基づいて、入力画像のi
番目の罫線IP(i)が、モデルのj番目の罫線MO
(j)に対応するかどうかの可能性を判断し、対応する
可能性があれば、マッチングテーブルのi行j列の要素
にノードを配置する(ステップS72)。
Next, based on the global information, the i of the input image is
The th ruled line IP (i) is the j th ruled line MO of the model.
Whether or not it corresponds to (j) is judged, and if there is a possibility of correspondence, a node is arranged in the element at the i-th row and the j-th column of the matching table (step S72).

【0081】次に、詳細情報に基づいて、配置されたノ
ードの中で、互いに特定の関係を満たすもの同士、すな
わち両立するもの同士の組み合わせを探索する(ステッ
プS73)。そして、それらのノードを同じグループに
属するノードとみなして、パスで結ぶ。図10のマッチ
ングテーブルの場合は、例えば、図18に示すようなパ
スが生成される。
Next, based on the detailed information, among the arranged nodes, those which satisfy a specific relationship with each other, that is, those which are compatible with each other are searched for (step S73). Then, those nodes are regarded as nodes belonging to the same group and are connected by a path. In the case of the matching table of FIG. 10, for example, a path as shown in FIG. 18 is generated.

【0082】ここで、i行j列のノードn(i,j)と
k行l列のノードn(k,l)が特定の関係を満たすと
は、入力画像のi番目の罫線とk番目の罫線の相対的関
係が、モデルのj番目の罫線とl番目の罫線の相対的関
係に比例していることを指す。言い換えれば、入力画像
のi番目の罫線とモデルのj番目の罫線をぴったり重ね
合わせたとき、入力画像のk番目の罫線とモデルのl番
目の罫線がぴったり重なり合う状況を指す。
Here, the fact that the node n (i, j) at the i-th row and the j-th column and the node n (k, l) at the k-th row and the l-th column satisfy a specific relationship means that the i-th ruled line and the k-th line of the input image are satisfied. Indicates that the relative relationship of the ruled line of is proportional to the relative relationship of the j-th ruled line and the l-th ruled line of the model. In other words, when the i-th ruled line of the input image and the j-th ruled line of the model are exactly overlapped, the k-th ruled line of the input image and the l-th ruled line of the model are exactly overlapped.

【0083】このようなノード同士を1本のパスで結ぶ
ことで、ノードがいくつかのグループに分類される。ノ
ードの数が多いグループほど、入力文書とモデルが類似
していることを強く表していると考えられるので、この
ようなグループを対象とすることで、モデルマッチング
における詳細類似度の計算を効率よく行うことができ
る。
By connecting such nodes with one path, the nodes are classified into several groups. It is considered that a group with a larger number of nodes strongly indicates that the input document and the model are more similar. Therefore, by targeting such a group, the detailed similarity calculation in model matching can be performed efficiently. It can be carried out.

【0084】また、あるノードと両立するノードを探索
する際、処理の効率を高めるため、常に前者のノードの
右下の領域に位置するノードを探索対象とする。これに
より、ノード数の多いパスを高速に求めることが可能に
なる。
When searching for a node compatible with a certain node, the node located in the lower right area of the former node is always set as the search target in order to improve the processing efficiency. As a result, it becomes possible to quickly obtain a path having a large number of nodes.

【0085】次に、得られたパスの集合の中で、互いに
矛盾しないパスの組み合わせを求め、いくつかの組み合
わせのうち、含まれるノード数が最大のものを探索する
(ステップS74)。そして、そのパスの組み合わせを
最適パス集合とする。2つのパスが互いに矛盾しないと
は、それぞれのパスの中のノードに対応する罫線の集合
の範囲が、互いに重なり合わないということである。
Next, among the obtained sets of paths, combinations of paths that do not contradict each other are obtained, and a combination having the largest number of nodes is searched from some combinations (step S74). Then, the combination of the paths is set as the optimum path set. The two paths do not conflict with each other, that is, the ranges of the ruled line sets corresponding to the nodes in the respective paths do not overlap each other.

【0086】次に、入力画像の罫線数をph、モデルの
罫線数をmh、最適パス集合に含まれるノード数をma
xhとして、入力画像とモデルの罫線の詳細類似度SH
を次式により求め(ステップS75)、処理を終了す
る。 SH=maxh/ph+maxh/mh (10) この類似度SHは、入力画像の罫線のうち、最適パス集
合に対応するものの割合と、モデルの罫線のうち、最適
パス集合に対応するものの割合の和を表し、一般に、入
力画像とモデルの罫線の特徴が類似しているほど大きな
値をとる。(10)式の詳細類似度を横罫線と縦罫線の
それぞれのマッチングテーブルについて求め、それらの
和をとることで、最終的な詳細類似度が得られる。
Next, the number of ruled lines in the input image is ph, the number of ruled lines in the model is mh, and the number of nodes included in the optimum path set is ma.
xh is the detailed similarity SH between the input image and the model ruled line
Is calculated by the following equation (step S75), and the process is terminated. SH = maxh / ph + maxh / mh (10) This similarity SH is the sum of the ratio of the ruled lines of the input image corresponding to the optimum path set and the ratio of the model ruled lines corresponding to the optimum path set. In general, the larger the characteristic of the ruled line of the input image and that of the model, the larger the value. The final detailed similarity is obtained by obtaining the detailed similarity of the expression (10) for each of the matching tables of the horizontal ruled line and the vertical ruled line and taking the sum of them.

【0087】フォーマット識別装置は、図9のステップ
S15において、各モデルの詳細類似度を比較し、詳細
類似度が最も大きいモデルを、入力画像に対応する表の
フォーマットとする。
In step S15 of FIG. 9, the format identification device compares the detailed similarities of the models and sets the model having the largest detailed similarity as the format of the table corresponding to the input image.

【0088】以上説明した実施形態では、罫線の位置お
よび長さを特徴量として用いて、入力画像とモデルのマ
ッチングテーブルを作成しているが、モデルマッチング
においては、表の構造を表す他の任意の特徴量を用いる
ことができる。
In the embodiment described above, the position and length of the ruled line are used as the feature amount to create the matching table of the input image and the model. However, in the model matching, any other arbitrary table structure can be used. Can be used.

【0089】例えば、縦罫線と横罫線の交点の座標を
(x,y)としたとき、交点の位置を表す特徴量(d
x,dy)は、次式により定義される。 dx=(x−x0)×100/W dy=(y−y0)×100/H (11) そして、入力文書側の交点とモデル側の交点とのマッチ
ングテーブルが作成され、対応可能な交点同士の組み合
わせがノードで表現される。この場合、入力文書側の交
点をIpとし、モデル側の交点をMpとしたとき、Ip
とMpのユークリッド距離があらかじめ決められたしき
い値th以下のとき、これらの交点は対応可能と判断さ
れる。
For example, when the coordinates of the intersection of the vertical ruled line and the horizontal ruled line are (x, y), the feature amount (d
x, dy) is defined by the following equation. dx = (x−x0) × 100 / W dy = (y−y0) × 100 / H (11) Then, a matching table of the intersection on the input document side and the intersection on the model side is created, and the corresponding intersections are possible. A combination of is represented by a node. In this case, when the intersection on the input document side is Ip and the intersection on the model side is Mp, Ip
If the Euclidean distance between Mp and Mp is less than or equal to a predetermined threshold value th, it is determined that these intersections can correspond.

【0090】あるいはまた、四方を罫線で囲まれた矩形
領域(矩形セル)の大きさと位置を特徴量として用い
て、入力文書側の矩形セルとモデル側の矩形セルとのマ
ッチングテーブルを作成してもよい。この場合は、大き
さと位置が類似している矩形セル同士が対応可能と判断
され、それらの組み合わせがノードで表現される。
Alternatively, a matching table of the rectangular cells on the input document side and the rectangular cells on the model side is created by using the size and position of the rectangular area (rectangular cell) surrounded by ruled lines on all four sides as the feature amount. Good. In this case, it is determined that rectangular cells having similar sizes and positions can correspond to each other, and the combination thereof is represented by a node.

【0091】いずれの特徴量を用いた場合でも、マッチ
ングテーブル上に配置される1つ以上のノードを含む行
の数と、1つ以上のノードを含む列の数を数えれば、そ
れらの数に基づいて、(9)式のような大域類似度を算
出することができる。したがって、その大域類似度を用
いて、大分類候補を絞り込むことができる。
No matter which feature quantity is used, if the number of rows including one or more nodes and the number of columns including one or more nodes arranged on the matching table are counted, these numbers are obtained. Based on this, it is possible to calculate the global similarity as expressed by equation (9). Therefore, the large classification candidates can be narrowed down using the global similarity.

【0092】[0092]

【発明の効果】本発明によれば、未知の表形式文書から
罫線構造を抽出し、あらかじめ辞書に登録されたモデル
のフォーマットとマッチングを行う際に、詳細なマッチ
ングを適用すべきモデル群を効果的に絞り込むことが可
能になる。その結果、辞書のモデル数が増大した場合で
も、安定した処理速度が実現される。
According to the present invention, when a ruled line structure is extracted from an unknown tabular document and matching is performed with a model format registered in a dictionary in advance, a model group to which detailed matching should be applied is effective. It becomes possible to narrow it down. As a result, a stable processing speed can be realized even when the number of dictionary models increases.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明のフォーマット識別装置の原理図であ
る。
FIG. 1 is a principle diagram of a format identification device of the present invention.

【図2】情報処理装置の構成図である。FIG. 2 is a configuration diagram of an information processing device.

【図3】フォーマット識別処理のフローチャートであ
る。
FIG. 3 is a flowchart of a format identification process.

【図4】基準幅、基準高、基準点を示す図である。FIG. 4 is a diagram showing a reference width, a reference height, and a reference point.

【図5】横罫線を示す図である。FIG. 5 is a diagram showing horizontal ruled lines.

【図6】縦罫線を示す図である。FIG. 6 is a diagram showing vertical ruled lines.

【図7】横罫線の詳細情報を示す図である。FIG. 7 is a diagram showing detailed information of horizontal ruled lines.

【図8】縦罫線の詳細情報を示す図である。FIG. 8 is a diagram showing detailed information of vertical ruled lines.

【図9】モデルマッチングのフローチャートである。FIG. 9 is a flowchart of model matching.

【図10】マッチングテーブルを示す図である。FIG. 10 is a diagram showing a matching table.

【図11】大分類モデルマッチングのフローチャート
(その1)である。
FIG. 11 is a flowchart (No. 1) of large classification model matching.

【図12】大分類モデルマッチングのフローチャート
(その2)である。
FIG. 12 is a flowchart (No. 2) of large classification model matching.

【図13】大分類モデルマッチングのフローチャート
(その3)である。
FIG. 13 is a flowchart (part 3) of large classification model matching.

【図14】大分類モデルマッチングのフローチャート
(その4)である。
FIG. 14 is a flowchart (No. 4) of large classification model matching.

【図15】マッチングテーブルのウィンドウを示す図で
ある。
FIG. 15 is a diagram showing a window of a matching table.

【図16】大分類候補決定処理のフローチャートであ
る。
FIG. 16 is a flowchart of a large classification candidate determination process.

【図17】詳細分類モデルマッチングのフローチャート
である。
FIG. 17 is a flowchart of detailed classification model matching.

【図18】マッチングテーブル上のパスを示す図であ
る。
FIG. 18 is a diagram showing paths on a matching table.

【符号の説明】[Explanation of symbols]

1 格納手段 2 比較手段 3 分類手段 4 計算手段 11 CPU 12 メモリ 13 入力装置 14 出力装置 15 外部記憶装置 16 媒体駆動装置 17 ネットワーク接続装置 18 光電変換装置 19 バス 20 可搬記憶媒体 21 辞書 31、32、33、34、36、37 罫線 35 頂点 41、42、43、44、45、46 罫線矩形 51 ウィンドウ 1 storage means 2 comparison means 3 classification means 4 calculation means 11 CPU 12 memories 13 Input device 14 Output device 15 External storage device 16 Medium drive 17 Network connection device 18 Photoelectric conversion device 19 bus 20 Portable storage medium 21 dictionary 31, 32, 33, 34, 36, 37 Ruled lines 35 vertices 41, 42, 43, 44, 45, 46 Ruled line rectangle 51 windows

───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06K 9/00 - 9/82 G06F 17/30 G06F 19/00 G06T 11/60 ─────────────────────────────────────────────────── ─── Continuation of the front page (58) Fields surveyed (Int.Cl. 7 , DB name) G06K 9/00-9/82 G06F 17/30 G06F 19/00 G06T 11/60

Claims (12)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 複数の表のフォーマットを探索して、与
えられた表画像に対応する表のフォーマットを求めるフ
ォーマット識別装置であって、 前記複数の表のフォーマットのそれぞれに含まれる各罫
線について、表全体に対する罫線の長さおよび位置の相
対的な値を表す概略情報を格納する格納手段と、 入力画像から抽出された各罫線の概略情報を前記複数の
表のフォーマットのそれぞれに含まれる各罫線の概略情
報と比較して、対応の可能性のある罫線同士の組み合わ
せを求める比較手段と、 前記複数の表のフォーマットのそれぞれについて、表の
フォーマットと前記入力画像の少なくとも一方の罫線
うち前記罫線同士の組み合わせに含まれる罫線の個数を
求め、得られた個数に基づいて該複数の表のフォーマッ
トから探索対象を絞り込む分類手段と 前記分類手段により絞り込まれた探索対象のフォーマッ
ト群に含まれる1つの表のフォーマットを対象にして、
前記罫線同士の組み合わせの情報に基づき、前記入力画
像に含まれる各罫線と該1つの表のフォーマットに含ま
れる各罫線との詳細なマッチングを行う詳細マッチング
手段と を備えることを特徴とするフォーマット識別装
置。
1. A format identification device that searches for a format of a plurality of tables to obtain a format of a table corresponding to a given table image, wherein each rule included in each of the formats of the plurality of tables.
For lines, the length and position of the ruled line relative to the entire table
The storing means for storing the outline information indicating the relative value and the outline information of each ruled line extracted from the input image
Summary information for each ruled line included in each of the table formats
Compared to broadcast, and comparing means for obtaining a combination of ruled lines between which a potential corresponding, for each format of said plurality of tables, the table
The number of ruled lines included in the combination of the ruled lines among at least one ruled line of the format and the input image is obtained, and the search target is narrowed down from the format of the plurality of tables based on the obtained number. means and, format to be searched that has been narrowed down by the classifying means
For the format of one table included in the group
Based on the information of the combination of the ruled lines, the input image
Each ruled line included in the image and included in the format of the one table
Detailed matching for detailed matching with each ruled line
Format identification apparatus, comprising a means.
【請求項2】 前記分類手段は、前記複数の表のフォー2. The classification means is a method for forming a list of the plurality of tables.
マットのそれぞれについて、表のフォーマットの罫線のFor each of the mats
うち前記罫線同士の組み合わせに含まれる罫線の割合Ratio of ruled lines included in the combination of ruled lines
と、前記入力画像の罫線のうち該罫線同士の組み合わせAnd a combination of the ruled lines of the input image
に含まれる罫線の割合との和を算出し、算出された和をCalculate the sum with the percentage of ruled lines included in
該表のフォーマットと該入力画像の類似度として用いてUsing the format of the table and the similarity of the input image
前記探索対象を絞り込むことを特徴とする請求項1記載2. The search target is narrowed down.
のフォーマット識別装置。Format identification device.
【請求項3】 前記詳細マッチング手段は、前記入力画3. The detailed matching means is configured to input the input image.
像に含まれる2本の罫線の間の長さおよび位置の相対的Relative length and position between two ruled lines in the image
な関係を表す詳細情報と、前記1つの表のフォーマットInformation showing the relationship and the format of the one table
に含まれる2本の罫線の間の長さおよび位置の相対的なOf the length and position between the two ruled lines contained in
関係を表す詳細情報とを用いて、前記詳細なマッチングThe detailed matching is performed using the detailed information indicating the relationship.
を行うことを特徴とする請求項1記載のフォーマット識The format identification according to claim 1, wherein
別装置。Another device.
【請求項4】 前記詳細マッチング手段は、前記入力画4. The detailed matching means is configured to input the input image.
像に含まれるp本の罫線と前記1つの表のフォーマットFormat of p ruled lines included in the image and the one table
に含まれるm本の罫線の対応関係を表すp行m列のマッP-by-m matrix that represents the correspondence between the m ruled lines included in
チングテーブルを生成し、該入力画像のi番目の罫線がGenerates a teaching table and the i-th ruled line of the input image is
該1つの表のフォーマットのj番目の罫線に対応する可Corresponding to the jth ruled line in the format of the one table
能性があるとき、該マッチングテーブルのi行j列の要When the matching table has the capability, the i-th row and the j-th column of the matching table are required.
素にノードを配置し、該入力画像の詳細情報と該1つのA node is arranged at the base, and detailed information of the input image and the one
表のフォーマットの詳細情報を用いて複数のノードを結Connect multiple nodes using detailed information in the table format.
ぶパスを生成し、生成されたパスを用いて該入力画像とPath is generated, and the input image is generated using the generated path.
該1つの表のフォーマットの詳細類似度を求めることをTo obtain the detailed similarity of the format of the one table
特徴とする請求項3記載のフォーマット識別装置。The format identification device according to claim 3, which is characterized in that.
【請求項5】 複数の表のフォーマットを探索して、与5. A format for a plurality of tables is searched for and given.
えられた表画像に対応する表のフォーマットを求めるフThe format of the table corresponding to the obtained table image is calculated.
ォーマット識別装置であって、A format identification device, 前記複数の表のフォーマットのそれぞれに含まれる各縦Each vertical included in each of the plurality of table formats
罫線と各横罫線について、縦罫線と横罫線の交点の位置Position of intersection of vertical and horizontal ruled lines for ruled lines and each horizontal ruled line
を表す概略情報を格納する格納手段と、Storage means for storing the outline information representing 入力画像から抽出された各交点の概略情報を前記複数のThe outline information of each intersection extracted from the input image
表のフォーマットのそれぞれに含まれる各交点の概略情Summary information of each intersection included in each of the table formats
報と比較して、対応の可能性のある交点同士の組み合わCombining the intersections that have a possibility of correspondence compared to the report
せを求める比較手段と、A comparison means for seeking 前記複数の表のフォーマットのそれぞれについて、表のFor each of the multiple table formats, the table
フォーマットと前記入力画像の少なくとも一方の交点のOf the intersection of the format and at least one of the input images
うち前記交点同士の組み合わせに含まれる交点の個数をThe number of intersections included in the combination of the intersections
求め、得られた個数に基づいて該複数の表のフォーマッThe format of the plurality of tables is calculated based on the obtained number.
トから探索対象を絞り込む分類手段と、Classification means to narrow down the search target from 前記分類手段により絞り込まれた探索対象のフォーマッThe format of the search target narrowed down by the classification means.
ト群に含まれる1つの表のフォーマットを対象にして、For the format of one table included in the group
前記入力画像と該1つの表のフォーマットとの詳細なマA detailed matrix of the input image and the format of the one table.
ッチングを行う詳細マッチング手段とを備えることを特It is equipped with detailed matching means for
徴とするフォーマット識別装置。Format identification device to collect.
【請求項6】 複数の表のフォーマットを探索して、与6. The format of a plurality of tables is searched for and given.
えられた表画像に対応する表のフォーマットを求めるフThe format of the table corresponding to the obtained table image is calculated.
ォーマット識別装置であって、A format identification device, 前記複数の表のフォーマットのそれぞれに含まれる罫線Ruled lines included in each of the plurality of table formats
で囲まれた各矩形領域について、矩形領域の大きさと位For each rectangular area enclosed by, the size and position of the rectangular area
置を表す概略情報を格納する格納手段と、Storage means for storing schematic information representing the position, 入力画像から抽出された各矩形領域の概略情報を前記複The outline information of each rectangular area extracted from the input image is
数の表のフォーマットのそれぞれに含まれる各矩形領域Each rectangular area contained in each of the number table formats
の概略情報と比較して、対応の可能性のある矩The quadrangle that may 形領域同Shape region same
士の組み合わせを求める比較手段と、Comparison means to find the combination of the 前記複数の表のフォーマットのそれぞれについて、表のFor each of the multiple table formats, the table
フォーマットと前記入力画像の少なくとも一方の矩形領A rectangular area of at least one of the format and the input image
域のうち前記矩形領域同士の組み合わせに含まれる矩形Rectangle included in the combination of the rectangular regions
領域の個数を求め、得られた個数に基づいて該複数の表The number of areas is calculated, and the plurality of tables are calculated based on the obtained number.
のフォーマットから探索対象を絞り込む分類手段と、Classification means to narrow down the search target from the format of 前記分類手段により絞り込まれた探索対象のフォーマッThe format of the search target narrowed down by the classification means.
ト群に含まれる1つの表のフォーマットを対象にして、For the format of one table included in the group
前記入力画像と該1つの表のフォーマットとの詳細なマA detailed matrix of the input image and the format of the one table.
ッチングを行う詳細マッチング手段とを備えることを特It is equipped with detailed matching means for
徴とするフォーマット識別装置。Format identification device to collect.
【請求項7】 複数の表のフォーマットを探索して、与
えられた表画像に対応する表のフォーマットを求める計
算機のためのプログラムを格納した記憶媒体であって、
該プログラムは、 前記複数の表のフォーマットのそれぞれに含まれる各罫
線について、表全体に対する罫線の長さおよび位置の相
対的な値を表す概略情報を格納し、 入力画像から抽出された各罫線の概略情報を前記複数の
表のフォーマットのそれぞれに含まれる各罫線の概略情
報と比較して、対応の可能性のある罫線同士の組み合わ
せを求め、 前記複数の表のフォーマットのそれぞれについて、表の
フォーマットと前記入力画像の少なくとも一方の罫線
うち前記罫線同士の組み合わせに含まれる罫線の個数を
求め、 得られた 個数に基づいて該複数の表のフォーマットから
探索対象を絞り込み、 絞り込まれた探索対象のフォーマット群に含まれる1つ
の表のフォーマットを対象にして、前記罫線同士の組み
合わせの情報に基づき、前記入力画像に含まれる各罫線
と該1つの表のフォーマットに含まれる各罫線との詳細
なマッチングを行う処理 を前記計算機に行わせることを
特徴とする計算機読み出し可能記憶媒体。
7. A storage medium storing a program for a computer that searches a plurality of table formats and obtains a table format corresponding to a given table image ,
The program is for each rule included in each of the formats of the plurality of tables.
For lines, the length and position of the ruled line relative to the entire table
Storing general information indicating a pair of values, the general information of each ruled line extracted from the input image
Summary information for each ruled line included in each of the table formats
Compared to broadcast, determined combination of ruled lines between which a potential corresponding, for each format of said plurality of tables, the table
The number of ruled lines included in the combination of the ruled lines among at least one ruled line of the format and the input image
Determined, based on the obtained number narrow down the search target from the format of said plurality of tables, one included in the format group narrowed search target
Combining the ruled lines with each other for the table format
Each ruled line included in the input image based on the matching information
And details of each ruled line included in the format of the one table
It is necessary to let the computer perform the process of performing the matching.
Characteristic computer-readable storage medium.
【請求項8】 複数の表のフォーマットを探索して、与8. A method for searching a format of a plurality of tables,
えられた表画像に対応する表のフォーマットを求める計A table for calculating the table format corresponding to the obtained table image.
算機のためのプログラムを格納した記憶媒体であって、A storage medium storing a program for a computer,
該プログラムは、The program is 前記複数の表のフォーマットのそれぞれに含まれる各縦Each vertical included in each of the plurality of table formats
罫線と各横罫線について、縦罫線と横罫線の交点の位置Position of intersection of vertical and horizontal ruled lines for ruled lines and each horizontal ruled line
を表す概略情報を格納し、Stores summary information representing 入力画像から抽出された各交点の概略情報を前記複数のThe outline information of each intersection extracted from the input image
表のフォーマットのそれぞれに含まれる各交点の概略情Summary information of each intersection included in each of the table formats
報と比較して、対応の可能性のある交点同士の組み合わCombining the intersections that have a possibility of correspondence compared to the report
せを求め、Ask for 前記複数の表のフォーマットのそれぞれについて、表のFor each of the multiple table formats, the table
フォーマットと前記入力画像の少なくとも一方の交点のOf the intersection of the format and at least one of the input images
うち前記交点同士の組み合わせに含まれる交点の個数をThe number of intersections included in the combination of the intersections
求め、Seeking, 得られた個数に基づいて該複数の表のフォーマットからFrom the format of the multiple tables based on the number obtained
探索対象を絞り込み、Narrow down the search target, 絞り込まれた探索対象のフォーマット群に含まれる1つOne included in the narrowed down search target format group
の表のフォーマットを対象にして、前記入力画像と該1The input image and the 1
つの表のフォーマットとの詳細なマッチングを行う処理To perform detailed matching with one table format
を前記計算機に行わせることを特徴とする計算機読み出Computer read-out characterized by causing the computer to perform
し可能記憶媒体。Storage media.
【請求項9】 複数の表のフォーマットを探索して、与9. The format of a plurality of tables is searched for and given.
えられた表画像に対応する表のフォーマットを求める計A table for calculating the table format corresponding to the obtained table image.
算機のためのプログラムを格納した記憶媒体であって、A storage medium storing a program for a computer,
該プログラムは、The program is 前記複数の表のフォーマットのそれぞれに含まれる罫線Ruled lines included in each of the plurality of table formats
で囲まれた各矩形領域について、矩形領域の大きさと位For each rectangular area enclosed by, the size and position of the rectangular area
置を表す概略情報を格納し、Stores the summary information that represents the 入力画像から抽出された各矩形領域の概略情報を前記複The outline information of each rectangular area extracted from the input image is
数の表のフォーマットのそれぞれに含まれる各矩形領域Each rectangular area contained in each of the number table formats
の概略情報と比較して、対応の可能性のある矩形領域同Comparing the outline information of
士の組み合わせを求め、Seeking a combination of 前記複数の表のフォーマットのそれぞれについて、表のFor each of the multiple table formats, the table
フォーマットと前記入力画像の少なくとも一方の矩形領A rectangular area of at least one of the format and the input image
域のうち前記矩形領域同士の組み合わせに含まれる矩形Rectangle included in the combination of the rectangular regions
領域の個数を求め、Find the number of regions, 得られた個数に基づいて該複数の表のフォーマットからFrom the format of the multiple tables based on the number obtained
探索対象を絞り込み、Narrow down the search target, 絞り込まれた探索対象のフォーマット群に含まれる1つOne included in the narrowed down search target format group
の表のフォーマットを対象にして、前記入力画像と該1The input image and the 1
つの表のフォーマットとの詳細なマッチングを行う処理To perform detailed matching with one table format
を前記計算機に行わせることを特徴とする計算機読み出Computer read-out characterized by causing the computer to perform
し可能記憶媒体。Storage media.
【請求項10】 複数の表のフォーマットを探索して、
与えられた表画像に対応する表のフォーマットを求める
フォーマット識別方法であって、前記複数の表のフォーマットのそれぞれに含まれる各罫
線について、表全体に対する罫線の長さおよび位置の相
対的な値を表す概略情報をあらかじめ格納しておき、 入力画像から抽出された各罫線の概略情報を前記複数の
表のフォーマットのそれぞれに含まれる各罫線の概略情
報と比較して、対応の可能性のある罫線同士の組み合わ
せを求め、 前記複数の表のフォーマットのそれぞれについて、表の
フォーマットと前記入力画像の少なくとも一方の罫線
うち前記罫線同士の組み合わせに含まれる罫線の個数を
求め、得られた 個数に基づいて該複数の表のフォーマットから
探索対象を絞り込み、 絞り込まれた探索対象のフォーマット群に含まれる1つ
の表のフォーマットを対象にして、前記罫線同士の組み
合わせの情報に基づき、前記入力画像に含まれる各罫線
と該1つの表のフォーマットに含まれる各罫線との詳細
なマッチングを行う ことを特徴とするフォーマット識別
方法。
10. Searching for multiple table formats,
A format identification method for obtaining a table format corresponding to a given table image, wherein each ruled line included in each of the plurality of table formats
For lines, the length and position of the ruled line relative to the entire table
The outline information indicating the opposite value is stored in advance, and the outline information of each ruled line extracted from the input image is stored in the plurality of
Summary information for each ruled line included in each of the table formats
Compared to broadcast, determined combination of ruled lines between which a potential corresponding, for each format of said plurality of tables, the table
Obtains the number of ruled lines contained in the combination of the ruled lines between the at least one of the borders of the format and the input image, narrow down the search target from the format of said plurality of tables based on the obtained number, the search narrowed down One included in the target format group
Combining the ruled lines with each other for the table format
Each ruled line included in the input image based on the matching information
And details of each ruled line included in the format of the one table
A format identification method characterized by various matching .
【請求項11】 複数の表のフォーマットを探索して、11. Searching for formats in multiple tables,
与えられた表画像に対応する表のフォーマットを求めるFind the table format for a given table image
フォーマット識別方法であって、A format identification method, 前記複数の表のフォーマットのそれぞれに含まれる各縦Each vertical included in each of the plurality of table formats
罫線と各横罫線について、縦罫線と横罫線の交点の位置Position of intersection of vertical and horizontal ruled lines for ruled lines and each horizontal ruled line
を表す概略情報をあらかじめ格納しておき、Is stored in advance, 入力画像から抽出された各交点の概略情報を前記複数のThe outline information of each intersection extracted from the input image
表のフォーマットのそれぞれに含まれる各交点の概略情Summary information of each intersection included in each of the table formats
報と比較して、対応の可能性のある交点同士の組み合わCombining the intersections that have a possibility of correspondence compared to the report
せを求め、Ask for 前記複数の表のフォーマットのそれぞれについて、表のFor each of the multiple table formats, the table
フォーマットと前記入力画像の少なくとも一方の交点のOf the intersection of the format and at least one of the input images
うち前記交点同士の組み合わせに含まれる交点の個数をThe number of intersections included in the combination of the intersections
求め、Seeking, 得られた個数に基づいて該複数の表のフォーマットからFrom the format of the multiple tables based on the number obtained
探索対象を絞り込み、Narrow down the search target, 絞り込まれた探索対象のフォーマット群に含まれる1つOne included in the narrowed down search target format group
の表のフォーマットをFormat of the table 対象にして、前記入力画像と該1The input image and the 1
つの表のフォーマットとの詳細なマッチングを行うことA detailed match with one table format
を特徴とするフォーマット識別方法。A method for identifying a format.
【請求項12】 複数の表のフォーマットを探索して、12. Searching for multiple table formats,
与えられた表画像に対応する表のフォーマットを求めるFind the table format for a given table image
フォーマット識別方法であって、A format identification method, 前記複数の表のフォーマットのそれぞれに含まれる罫線Ruled lines included in each of the plurality of table formats
で囲まれた各矩形領域について、矩形領域の大きさと位For each rectangular area enclosed by, the size and position of the rectangular area
置を表す概略情報をあらかじめ格納しておき、The outline information indicating the location is stored in advance, 入力画像から抽出された各矩形領域の概略情報を前記複The outline information of each rectangular area extracted from the input image is
数の表のフォーマットのそれぞれに含まれる各矩形領域Each rectangular area contained in each of the number table formats
の概略情報と比較して、対応の可能性のある矩形領域同Comparing the outline information of
士の組み合わせを求め、Seeking a combination of 前記複数の表のフォーマットのそれぞれについて、表のFor each of the multiple table formats, the table
フォーマットと前記入力画像の少なくとも一方の矩形領A rectangular area of at least one of the format and the input image
域のうち前記矩形領域同士の組み合わせに含まれる矩形Rectangle included in the combination of the rectangular regions
領域の個数を求め、Find the number of regions, 得られた個数に基づいて該複数の表のフォーマットからFrom the format of the multiple tables based on the number obtained
探索対象を絞り込み、Narrow down the search target, 絞り込まれた探索対象のフォーマット群に含まれる1つOne included in the narrowed down search target format group
の表のフォーマットを対象にして、前記入力画像と該1The input image and the 1
つの表のフォーマットとの詳細なマッチングを行うことA detailed match with one table format
を特徴とするフォーマット識別方法。A method for identifying a format.
JP10450597A 1997-04-22 1997-04-22 Apparatus and method for identifying format of table image Expired - Fee Related JP3380136B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10450597A JP3380136B2 (en) 1997-04-22 1997-04-22 Apparatus and method for identifying format of table image

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10450597A JP3380136B2 (en) 1997-04-22 1997-04-22 Apparatus and method for identifying format of table image

Publications (2)

Publication Number Publication Date
JPH10302023A JPH10302023A (en) 1998-11-13
JP3380136B2 true JP3380136B2 (en) 2003-02-24

Family

ID=14382364

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10450597A Expired - Fee Related JP3380136B2 (en) 1997-04-22 1997-04-22 Apparatus and method for identifying format of table image

Country Status (1)

Country Link
JP (1) JP3380136B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4750802B2 (en) * 2006-01-13 2011-08-17 富士通株式会社 Form processing program and form processing apparatus
JP5125573B2 (en) * 2008-02-12 2013-01-23 富士通株式会社 Region extraction program, character recognition program, and character recognition device
JP2017090974A (en) * 2015-11-02 2017-05-25 富士ゼロックス株式会社 Image processing device and program
JP6690089B2 (en) * 2016-04-25 2020-04-28 富士通株式会社 Form recognition method, form recognition device, and form recognition program

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ビジネス文書を対象としたキーワード自動抽出技術,FUJITSU,日本,1998年9月10日,Vol.49 No.5,pp.404−409

Also Published As

Publication number Publication date
JPH10302023A (en) 1998-11-13

Similar Documents

Publication Publication Date Title
US6721463B2 (en) Apparatus and method for extracting management information from image
Liu et al. Semi-supervised multi-label learning by constrained non-negative matrix factorization
US8131087B2 (en) Program and apparatus for forms processing
Laaksonen et al. Self-organising maps as a relevance feedback technique in content-based image retrieval
JP4332556B2 (en) Document / image retrieval method and program thereof, document / image registration apparatus and retrieval apparatus
US20130060786A1 (en) Text-based searching of image data
US20080107338A1 (en) Media material analysis of continuing article portions
US11393233B2 (en) System for information extraction from form-like documents
US20010019628A1 (en) Pattern recognition device for performing classification using a candidate table and method thereof
CN111460927A (en) Method for extracting structured information of house property certificate image
CN111626250A (en) Line dividing method and device for text image, computer equipment and readable storage medium
JP3380136B2 (en) Apparatus and method for identifying format of table image
US20140181124A1 (en) Method, apparatus, system and storage medium having computer executable instrutions for determination of a measure of similarity and processing of documents
CN110210572B (en) Image classification method, device, storage medium and equipment
JPH10240958A (en) Management information extracting device extracting management information from image and its method
Koskela Interactive image retrieval using self-organizing maps
JP4382074B2 (en) Form identification method
JP4302595B2 (en) Form identification device
US11256760B1 (en) Region adjacent subgraph isomorphism for layout clustering in document images
Nayef Geometric-based symbol spotting and retrieval in technical line drawings
Byun et al. An efficient form classification method using partial matching
Chan et al. Content-based image retrieval using regional representation
Shishibori et al. Fast retrieval algorithm for earth mover's distance using EMD lower bounds and a skipping algorithm
Jiang High Precision Deep Learning-Based Tabular Data Extraction
CN115862019A (en) Text processing method and device

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20021203

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071213

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081213

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091213

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091213

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101213

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111213

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111213

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121213

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121213

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131213

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees