JPH1011459A - Document registration system - Google Patents
Document registration systemInfo
- Publication number
- JPH1011459A JPH1011459A JP8164855A JP16485596A JPH1011459A JP H1011459 A JPH1011459 A JP H1011459A JP 8164855 A JP8164855 A JP 8164855A JP 16485596 A JP16485596 A JP 16485596A JP H1011459 A JPH1011459 A JP H1011459A
- Authority
- JP
- Japan
- Prior art keywords
- document
- area
- attribute
- document image
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Processing Or Creating Images (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
【0001】[0001]
【発明の属する技術分野】本発明は、例えば、スキャナ
などから取り込んだ文書画像を検索キーと共にデータベ
ースに自動登録する文書登録システムに関する。[0001] 1. Field of the Invention [0002] The present invention relates to a document registration system for automatically registering a document image taken from a scanner or the like together with a search key in a database.
【0002】[0002]
【従来の技術】近年、紙を媒体とした書類を電子化し
て、書類をコンピュータ内に蓄積あるいは管理するよう
なファイリングシステムの需要が高まっている。従来の
この種のファイリングシステムでは、例えばファクシミ
リやスキャナを通して書類の文書画像(ラスタイメー
ジ)を取得し、これをコンピュータ内の記憶装置に随時
登録する。その際、書類検索を考慮して、文書画像の登
録時にその文書画像に対応する検索キーをキーボード等
によって入力している。2. Description of the Related Art In recent years, there has been an increasing demand for a filing system which digitizes a paper-based document and stores or manages the document in a computer. In a conventional filing system of this type, a document image (raster image) of a document is acquired through, for example, a facsimile or a scanner, and the document image is registered in a storage device in a computer as needed. At this time, a search key corresponding to the document image is input using a keyboard or the like when the document image is registered in consideration of the document search.
【0003】図16は、文書画像の登録時にユーザが必
要な検索キーを入力するために表示されるシステム画面
例を示す図である。このシステム画面上には、例えば登
録日、著者、題名、ジャンル、キーワード等の各領域が
表示されており、各領域に必要な情報が入力されたとき
に、それが文書画像と共にデータベースに登録されるよ
うになっている。FIG. 16 is a diagram showing an example of a system screen displayed to allow a user to input a necessary search key when registering a document image. On this system screen, for example, each area such as a registration date, an author, a title, a genre, and a keyword is displayed. When necessary information is input to each area, the information is registered in a database together with a document image. It has become so.
【0004】[0004]
【発明が解決しようとする課題】しかしながら、従来の
文書登録システムでは、各文書画像毎に図16に示され
るようなシステム画面を見てキーボード等から手作業で
検索キーを登録しなければならないため、登録文書画像
の量が増えるにつれて登録作業時の負担が大きくなると
いった問題があった。However, in the conventional document registration system, it is necessary to manually register a search key from a keyboard or the like while viewing a system screen as shown in FIG. 16 for each document image. However, there has been a problem that the burden on the registration work increases as the amount of the registered document image increases.
【0005】また、例えばキーワードなどを検索キーと
して登録する場合、そのキーワードがユーザの主観によ
って異なる場合は検索効率が著しく低下する問題もあっ
た。[0005] In addition, for example, when a keyword or the like is registered as a search key, if the keyword differs depending on the subjectivity of the user, there is a problem that the search efficiency is significantly reduced.
【0006】そこで、本発明の課題は、入力された文書
画像を登録するときに、その文書画像から自動的に最適
な検索キーを生成して登録することができる、改良され
た文書登録システムを提供することにある。Accordingly, an object of the present invention is to provide an improved document registration system capable of automatically generating and registering an optimum search key from an input document image when registering the input document image. To provide.
【0007】[0007]
【課題を解決するための手段】上記課題を解決するた
め、本発明は、入力された文書画像を該文書画像に対応
する検索キーと共にデータベースに登録する文書登録手
段を備え、前記検索キーに基づいて登録済みの文書画像
を検索する文書登録システムにおいて、前記文書登録手
段が、前記文書画像上の文字領域、表領域、図領域など
の属性別領域及びその位置情報を特定する文書認識処理
部を有し、この特定した属性別領域の属性及び位置情報
を含んで前記検索キーを自動生成することを特徴とす
る。In order to solve the above-mentioned problems, the present invention comprises document registration means for registering an input document image in a database together with a search key corresponding to the document image, based on the search key. In the document registration system for searching for a registered document image, the document registration unit includes a document recognition processing unit that specifies attribute-based areas such as a character area, a table area, and a figure area on the document image and position information thereof. And automatically generating the search key including the attribute and position information of the specified attribute-based area.
【0008】文書認識処理部は、具体的には、前記文書
画像が傾いている場合にその傾き補正を行う画像正規化
部、前記文書画像または傾き補正がなされた文書画像か
ら基本矩形領域の抽出を行う基本矩形領域抽出部、抽出
された基本矩形領域を必要に応じて統合する領域統合
部、基本矩形領域または統合された領域が文字、図、表
等のいずれの属性に該当するかを判別する領域属性判別
部を備えて構成する。前記画像正規化部は、例えば、前
記文書画像における行方向及び列方向の各画素周辺分布
を検出し、各方向の白分布が最大になるように当該文書
画像を回転させるように構成する。More specifically, the document recognition processing section includes an image normalizing section for correcting the inclination of the document image when the document image is inclined, and extracting a basic rectangular area from the document image or the document image subjected to the inclination correction. A basic rectangular area extracting unit, an area integrating unit that integrates the extracted basic rectangular areas as necessary, and determines whether the basic rectangular area or the integrated area corresponds to a character, a figure, a table, or any other attribute. And a region attribute discriminating unit. The image normalization unit is configured to detect, for example, the peripheral distribution of each pixel in the row direction and the column direction in the document image, and rotate the document image so that the white distribution in each direction is maximized.
【0009】また、前記領域属性判別部は、例えば、統
合された領域に含まれる基本矩形領域の幅と高さの分
散、及び各領域内の線分の数とその長さを求め、各分散
の値、線分の数、及び線分長に応じて当該領域の属性
が、文字、表、図のいずれであるかを判別するように構
成する。Further, the area attribute discriminating section obtains, for example, the variance of the width and height of the basic rectangular area included in the integrated area, the number of line segments in each area, and the length thereof. , The number of line segments, and the length of the line segments to determine whether the attribute of the area is a character, a table, or a figure.
【0010】前記領域属性判別部は、また、例えば、文
字と判定された注目領域の近隣の領域からの位置ずれ量
を算出し、この位置ずれ量が規定値以下のときに当該注
目領域を前記近隣の領域の題表示領域と判定するように
構成する。The area attribute discriminating unit calculates, for example, a positional shift amount from an area adjacent to the target area determined to be a character. When the positional shift amount is equal to or less than a specified value, the target area is determined. The title display area is determined to be a neighboring area.
【0011】本発明の他の文書登録システムは、前記文
書登録手段が、前記文書画像上の文字領域、表領域、図
領域などの属性別領域及びその位置情報を特定する文書
認識処理部と、特定された属性別領域及びその位置情報
に基づいて文書フォーマットによる分類を行う文書分類
処理部とを有し、この分類結果を前記検索キーに含ませ
ることを特徴とする。In another document registration system according to the present invention, the document registration means specifies a region by attribute such as a character region, a table region, and a drawing region on the document image and position information thereof, A document classification processing unit for performing classification in a document format based on the specified attribute-based area and its position information, wherein the classification result is included in the search key.
【0012】このような文書登録システムにおいて、前
記文書分類処理部は、例えば、前記文書認識処理部で認
識された属性別領域の属性の数に基づいて、当該文書画
像を文字主体の「文字的文書」、表主体の「表的文
書」、図主体の「図的文書」などの一般的文書種別に分
類するように構成する。In such a document registration system, the document classification processing unit converts the document image into a character-based “character-based” based on, for example, the number of attributes of the attribute-based area recognized by the document recognition processing unit. It is configured to be classified into general document types such as "document", "table document" mainly composed of tables, and "graphic document" composed mainly of figures.
【0013】あるいは、所定方向における前記基本矩形
領域または統合領域の存在頻度及び個々の領域の面積の
関数に基づいて当該文書画像の段組の種類を判別し、判
別された段組別に前記文書画像を分類するように構成す
る。Alternatively, the type of the column of the document image is determined based on the existence frequency of the basic rectangular region or the integrated region in a predetermined direction and the function of the area of each region, and the document image is determined for each determined column. Is configured to be classified.
【0014】あるいは、前記文書認識処理部で認識され
た属性別領域の属性及び位置情報に基づいて文書画像の
文書特徴を表す特徴ベクトルを生成する特徴ベクトル生
成手段と、予め生成した複数の特徴ベクトルをそれぞれ
文書フォーマット別にグループ分けして格納した辞書部
と、前記特徴ベクトル生成手段が生成した特徴ベクトル
と前記辞書部に格納された各特徴ベクトルとの距離を比
較して、該距離がより小さい特徴ベクトルの属する一つ
のグループを特定するグループ特定手段とを有し、この
特定されたグループ別に前記文書画像を分類するように
構成する。Alternatively, a feature vector generating means for generating a feature vector representing a document feature of a document image based on the attribute and position information of the attribute-based area recognized by the document recognition processing section; Is compared with the distance between the feature vector generated by the feature vector generating means and each feature vector stored in the dictionary unit, and a feature value having a smaller distance is compared. Group specifying means for specifying one group to which the vector belongs, and the document images are classified according to the specified group.
【0015】[0015]
【発明の実施の形態】以下、図面を参照しながら本発明
の実施形態を詳細に説明する。図1は、本発明の文書登
録システムを、インターネットに接続して使用する場合
の実施形態を示すブロック構成図である。この文書登録
システムは、文書画像を登録して検索可能に管理するサ
ーバ1と、このサーバ1にLAN(ローカル・エリア・
ネットワーク)17を介して接続される複数のWWW
(ワールド・ワイド・ウエブ)クライアント端末18と
を含んで構成される。Embodiments of the present invention will be described below in detail with reference to the drawings. FIG. 1 is a block diagram showing an embodiment in which the document registration system of the present invention is used by connecting to the Internet. The document registration system includes a server 1 for registering a document image and managing the document image so as to be searchable, and a LAN (local area
A plurality of WWWs connected via a network 17
(World Wide Web) and a client terminal 18.
【0016】サーバ1の構成は、登録系と検索系とに分
けられる。登録系は、登録用の文書10の文書画像を取
得するスキャナ11、取得した文書10の文書画像を認
識する文書認識処理部12、文書認識処理部12で認識
された文書画像を分類するとともに対応する検索キーを
自動生成する文書分類処理部13、分類された文書画像
とその文書画像に対応する検索キーを格納する文書デー
タベース14を備えて構成される。また、検索系は、L
AN17に接続されたhttpd(ハイパーテキスト転
送プロトコル・デーモン)16及び検索を行うデータベ
ースAPI(アプリケーション・プログラム・インタフ
ェース)15を含んで構成される。なお、説明の便宜
上、文字画像はモノクロ画像であるとする。The configuration of the server 1 is divided into a registration system and a search system. The registration system includes a scanner 11 for acquiring a document image of the document 10 for registration, a document recognition processing unit 12 for recognizing the document image of the acquired document 10, and classifying and responding to the document images recognized by the document recognition processing unit 12. And a document database 14 for storing classified document images and search keys corresponding to the document images. The search system is L
It comprises an httpd (hypertext transfer protocol daemon) 16 connected to the AN 17 and a database API (application program interface) 15 for searching. For convenience of explanation, it is assumed that the character image is a monochrome image.
【0017】まず、上記構成の文書登録システムの登録
系の動作を説明する。まず、文書認識処理部12の基本
的な機能ブロックを図2を参照して説明する。文書認識
処理部12は、スキャナ11から取り込んだ文書画像に
ついて、スキャン時の傾きの補正を行って正規化を行う
画像正規化部121と、正規化された文書画像から基本
矩形領域の抽出を行う基本矩形抽出部122と、抽出さ
れた基本矩形の統合を行う領域統合部123と、統合し
た領域についてそれぞれ属性判別を行う領域属性判別部
124と、文字の属性をもつ領域に対して文字の自動認
識処理を行う文字認識部125とを備えている、なお、
文字認識部125では、例えば市販されているOCRを
使用することができる。First, the operation of the registration system of the document registration system having the above configuration will be described. First, basic functional blocks of the document recognition processing unit 12 will be described with reference to FIG. The document recognition processing unit 12 corrects the inclination of a document image captured from the scanner 11 during scanning to normalize the document image, and extracts a basic rectangular area from the normalized document image. A basic rectangle extraction unit 122, an area integration unit 123 that integrates the extracted basic rectangles, an area attribute determination unit 124 that performs attribute determination on each of the integrated areas, and an automatic character A character recognition unit 125 for performing a recognition process.
In the character recognition unit 125, for example, a commercially available OCR can be used.
【0018】各機能ブロック121〜125の内容をよ
り詳しく説明する。図3〜図5は、画像正規化部121
の機能の説明図である。画像正規化に際しては、スキャ
ナ11で取得した文書画像の上をx軸方向(左から右へ
の方向)とy軸方向(上から下へ方向)にそれぞれ走査
して黒画素の数を検出する。図3は、文書画像31と、
この文書画像31をy軸方向に走査して得られる黒画素
数の周辺分布32と、文書画像31をx軸方向に走査し
て得られる画素数の周辺分布33が示されている。The contents of the function blocks 121 to 125 will be described in more detail. 3 to 5 show the image normalization unit 121.
FIG. 4 is an explanatory diagram of the function of FIG. At the time of image normalization, the number of black pixels is detected by scanning the document image acquired by the scanner 11 in the x-axis direction (from left to right) and in the y-axis direction (from top to bottom). . FIG. 3 shows a document image 31 and
A peripheral distribution 32 of the number of black pixels obtained by scanning the document image 31 in the y-axis direction and a peripheral distribution 33 of the number of pixels obtained by scanning the document image 31 in the x-axis direction are shown.
【0019】この文書画像31の傾きが正常の(つまり
傾いていない)場合は、図4(a)に示されるように、
周辺分布における行間や右端、左端、上端、下端の余白
に対応する白の分布(黒画素数が0の部分)が明確にな
っている。これに対して、傾いた文書画像41の場合、
y方向の周辺分布42とx方向の周辺分布43における
白の分布は図4(b)に示されるように相対的に減少し
ている。このように、文書画像の傾きの有無は、x方向
及びy方向の周辺分布から判定可能であり、文字画像が
全く傾の無い場合はx方向及びy方向の周辺分布におけ
る白分布が最大となっている。When the document image 31 has a normal inclination (that is, is not inclined), as shown in FIG.
The white distribution (portion where the number of black pixels is 0) corresponding to the margins between the lines and the margins at the right end, the left end, the upper end, and the lower end in the peripheral distribution is clear. On the other hand, in the case of the inclined document image 41,
The distribution of white in the peripheral distribution 42 in the y direction and the peripheral distribution 43 in the x direction is relatively reduced as shown in FIG. As described above, the presence or absence of the inclination of the document image can be determined from the peripheral distribution in the x direction and the y direction. When the character image has no inclination, the white distribution in the peripheral distribution in the x direction and the y direction becomes maximum. ing.
【0020】画像正規化部121では、もし、図4
(b)のように文書画像41が傾いているとき、x方向
及びy方向の周辺分布42,43における白分布を最大
にするようにその文書画像41を回転させる。図5は、
周辺分布における白分布を最大にする回転角度の検出方
法の説明図である。図5から明らかなように、本実施形
態では、x方向及びy方向の周辺分布における白分布の
長さの合計(白のRunLength)と回転角度との
関係から、白分布の長さが最大となる回転角度tを検出
する。そして、この回転角度tだけ文書画像を回転す
る。In the image normalizing section 121, if
When the document image 41 is inclined as shown in (b), the document image 41 is rotated so as to maximize the white distribution in the peripheral distributions 42 and 43 in the x and y directions. FIG.
It is explanatory drawing of the detection method of the rotation angle which maximizes the white distribution in a peripheral distribution. As is clear from FIG. 5, in the present embodiment, from the relationship between the total length of white distributions in the peripheral distribution in the x direction and the y direction (Run Length of white) and the rotation angle, the length of the white distribution is maximum. Is detected. Then, the document image is rotated by the rotation angle t.
【0021】図6は基本矩形抽出部122における基本
矩形抽出過程の説明図であり、(a)は文書画像の3×
3の画素正方領域である。図示の例では、黒色画素P
(i,j)を中心として正方領域の左上から時計回りの
方向に8個の画素がP(i−1,j−1)、P(i,j
−1)、P(i+1,j−1)、P(i+1,j)、P
(i+1,j+1)、P(i,j+1)、P(i−1,
j+1)、P(i−1,j)の順に取り巻いている。基
本矩形抽出部122では、この黒色画素P(i,j)を
取り巻く8個の画素について、黒か白かの判定を行う。
黒画素であると判定されたそれぞれの画素については、
新たに黒画素と判定されたものを中心にそれを取り巻く
8個の画素について再び黒か否かの判定を行う。この操
作を新たな黒画素が見い出されなくなるまで繰り返す。
一つの操作が終了して得られた矩形領域の例を図6
(b)に示す。FIGS. 6A and 6B are explanatory diagrams of a basic rectangle extracting process in the basic rectangle extracting section 122. FIG.
3 is a pixel square area. In the illustrated example, the black pixel P
Eight pixels are P (i−1, j−1) and P (i, j) in the clockwise direction from the upper left of the square area around (i, j).
-1), P (i + 1, j-1), P (i + 1, j), P
(I + 1, j + 1), P (i, j + 1), P (i-1,
j + 1) and P (i-1, j). The basic rectangle extraction unit 122 determines whether the eight pixels surrounding the black pixel P (i, j) are black or white.
For each pixel determined to be a black pixel,
A determination is again made as to whether or not the pixel newly determined to be a black pixel is black with respect to eight pixels surrounding the pixel. This operation is repeated until no new black pixel is found.
FIG. 6 shows an example of a rectangular area obtained after one operation is completed.
(B).
【0022】抽出された各基本矩形は、領域統合部12
3で統合される。統合のロジックとしては、図7(a)
に示されるロジックと図7(b)に示されるロジックの
いずれかを適用することができる。図7(a)のロジッ
クでは、ある矩形領域Ciに注目し、その矩形領域Ci
の一対の長辺及び短辺からそれぞれ外方に一定距離xd
ist,ydistだけ離れた範囲に近接空間を設定す
る。上記距離xdist,ydistは文書画像の解像
度に対応した距離である。そして、この近接空間内にあ
る他の矩形領域Cjを検出し、これを包括するような統
合領域Ck1を定める。一方、図7(b)のロジックで
は、ある矩形領域Ciに注目してこれに少なくとも一部
分が重なる、あるいはこれを含む他の矩形領域Cjを求
め、これらを包括する統合領域Ck2を定める。領域統
合部123では、前段の基本矩形抽出部1で抽出した全
ての基本矩形領域について、上記いずれかのロジックを
適用して領域統合を行う。Each of the extracted basic rectangles is stored in the area integrating unit 12.
3 is integrated. As the integration logic, FIG.
7 and the logic shown in FIG. 7B can be applied. In the logic of FIG. 7A, attention is paid to a certain rectangular area Ci, and the rectangular area Ci
A fixed distance xd outward from the pair of long and short sides, respectively
An adjacent space is set in a range separated by ist and ydist. The distances xdist and ydist are distances corresponding to the resolution of the document image. Then, another rectangular area Cj in the close space is detected, and an integrated area Ck1 including the rectangular area Cj is determined. On the other hand, in the logic of FIG. 7B, another rectangular area Cj that at least partially overlaps or includes a certain rectangular area Ci is obtained by focusing on a certain rectangular area Ci, and an integrated area Ck2 including these is determined. The area integration unit 123 performs area integration by applying any of the above logics to all the basic rectangular areas extracted by the basic rectangle extraction unit 1 in the preceding stage.
【0023】統合された各領域は、領域属性判別部12
4で、その属性が判別される。領域属性判別部124に
おける処理手順は図8に示すとおりであり、まず、統合
された各領域について領域内の線分抽出を行う(S1
1)。次に、領域内の基本矩形の幅wと高さhの分散σ
w 2、σh 2を下記(1ー1),(1-2)式によって算出するととも
に、各分散σw 2、σh 2が、それぞれしきい値wvarとh
varより小さいか否かを判定する(S12)。なお、下
記式において、Nは矩形領域の総数、waは矩形領域の
幅の平均値、haは矩形領域の高さの平均値である。Each integrated area is assigned to an area attribute discriminating unit 12.
At 4, the attribute is determined. The processing procedure in the area attribute discriminating unit 124 is as shown in FIG. 8, and first, a line segment in the area is extracted for each integrated area (S1).
1). Next, the variance σ of the width w and the height h of the basic rectangle in the area
w 2 and σ h 2 are calculated according to the following equations (1-1) and (1-2), and the respective variances σ w 2 and σ h 2 are determined by thresholds w var and h
It is determined whether it is smaller than var (S12). In the equation below, N is the total number of the rectangular region, the w a mean value of the width of the rectangular area, h a is the mean value of the height of the rectangular area.
【0024】[0024]
【数1】 (Equation 1)
【0025】各分散σw 2、σh 2がそれぞれしきい値より
小さい場合は(S12:True)、抽出された線分の
うち、その長さが領域の幅または高さの30%以上の線
分が存在するか否かを判定する(S13)。存在しない
場合(S13:False)、その領域を文字領域と判
定し(S14)、図表題識別処理を実行する(S1
5)。一方、S12の判定ステップにおいて各分散の少
なくとも一方がしきい値以上の場合(S12:Fals
e)、あるいは各分散がしきい値より小さいが(S1
2:True)、抽出された線分の内、その長さが領域
の幅または高さの30%以上のものがない場合は(S1
3:True)、その領域を表領域または図領域と判定
し、S16の処理に進む。If each of the variances σ w 2 and σ h 2 is smaller than the threshold value (S12: True), the length of the extracted line segment is 30% or more of the width or height of the region. It is determined whether or not a line segment exists (S13). If it does not exist (S13: False), the area is determined to be a character area (S14), and a figure title identification process is executed (S1).
5). On the other hand, when at least one of the variances is equal to or greater than the threshold in the determination step of S12 (S12: False
e) or each variance is smaller than the threshold (S1
2: True), if there is no extracted line segment whose length is 30% or more of the width or height of the region (S1)
3: True), the area is determined to be a table area or a figure area, and the process proceeds to S16.
【0026】S16の処理では、表領域と図領域の判別
を行う。即ち、抽出された線分の内、領域の幅の80%
以上の長さのものが2つ以上存在し、かつ、領域の高さ
の80%以上の長さのものが2つ以上存在するか否かを
判定する。存在する場合は(S16:True)その領
域を表領域と判定し(S17)、存在しない場合は(S
16:False)その領域を図領域と判定する。In the process of S16, a table area and a figure area are determined. That is, of the extracted line segments, 80% of the width of the area
It is determined whether there are two or more objects having the above length and two or more objects having a length of 80% or more of the height of the region. If it exists (S16: True), the area is determined to be a table area (S17).
16: False) The area is determined to be a figure area.
【0027】ここで、図表題識別処理(S15)の内容
を図9を参照して説明する。図表題識別処理では、図9
に示すように、領域属性判別部124において文字領域
と判定された領域Ci(矩形左上座標:xi,yi)に
注目し、近隣の矩形領域Cj(矩形左上座標:xj,y
j)について、y方向の距離ydistと中心の位置ず
れcdistを算出する。そして、下記式により図表題
識別処理を行う。なお、下式において、wi,wj,h
i,hjは、それぞれ、矩形領域Ci,Cjの幅と高さ
を表す。Here, the contents of the figure title identification processing (S15) will be described with reference to FIG. In the figure title identification processing, FIG.
As shown in the figure, the area Ci (rectangular upper left coordinate: xi, yi) determined to be a character area by the area attribute determining unit 124 is focused on, and a neighboring rectangular area Cj (rectangular upper left coordinate: xj, y) is noted.
For j), the distance ydist in the y direction and the center displacement cdist are calculated. Then, figure title identification processing is performed by the following equation. In the following equation, wi, wj, h
i and hj represent the width and height of the rectangular areas Ci and Cj, respectively.
【0028】[0028]
【数2】 (Equation 2)
【0029】上記判定式を満たす場合、矩形領域Cjが
図領域であれば矩形領域Ciは図題についての文字領域
と判定され、矩形領域Cjが表領域であれば矩形領域C
iは表題についての文字領域と判定される。When the above determination formula is satisfied, if the rectangular area Cj is a figure area, the rectangular area Ci is determined to be a character area for the title. If the rectangular area Cj is a table area, the rectangular area C is determined.
i is determined to be a character area for the title.
【0030】以上の処理の結果、図10に示されるよう
な文書画像が得られる。図10から、文字を主体とする
文字領域、図を主体とする図領域、そして、表を主体と
する表領域に分けられていることが分かる。さらに、図
領域あるいは表領域に近接して、図題あるいは表題に対
応する文字領域が存在している。As a result of the above processing, a document image as shown in FIG. 10 is obtained. From FIG. 10, it can be seen that the text area is mainly divided into a character area mainly composed of characters, a figure area mainly composed of figures, and a table area mainly composed of tables. Further, a character area corresponding to a title or a title exists near the figure area or the table area.
【0031】次に、文書分類処理部13の動作について
説明する。文書分類処理部13は、文書認識処理部12
の処理結果に基づいて文書フォーマット(体裁)による
分類を行う。より具体的には、文書画像を、文字が主体
の「文字的文書」、表が主体の「表的文書」、図が主体
の「図的文書」などに分類する。これを一般的文書種別
分類と称する。また、雑誌や論文などに見られる2段
組、3段組などに分類する。これを段組分類と称する。
さらに、目的に応じてユーザが定義したフォーマットに
分類する。これをユーザ定義分類と称する。Next, the operation of the document classification processing section 13 will be described. The document classification processing unit 13 includes the document recognition processing unit 12
Classification is performed based on the document format (format) based on the processing result. More specifically, the document images are classified into “character documents” mainly composed of characters, “table documents” mainly composed of tables, and “graphical documents” mainly composed of figures. This is called a general document type classification. In addition, it is classified into a two-column system, a three-column system, and the like found in magazines and articles. This is called a column classification.
Further, the data is classified into formats defined by the user according to the purpose. This is called a user-defined classification.
【0032】まず、一般的文書種別分類について説明す
る。文書分類処理部13は、表領域Ctiの面積をSt
i、図領域Cfiの面積をSfi、全領域の面積をSと
したとき、下記判定式によって、表的文書か、図的文書
か、あるいは文字的文書かの判別を行う。First, the general document type classification will be described. The document classification processing unit 13 calculates the area of the table area Cti as St
i, when the area of the graphic region Cfi is Sfi and the area of all the regions is S, it is determined whether the document is a table document, a graphic document, or a character document by the following determination formula.
【0033】[0033]
【数3】 (Equation 3)
【0034】次に、段組分類について説明する。段組分
類に際しては、まず、各矩形領域のx方向の度数分布、
即ちx方向の矩形領域の原点(例えば領域の左上)の存
在頻度を調べ、x方向における階級値(一定範囲の代表
値)Riと、度数ni及び個々の領域面積Siの積ni
*Siとの関係(ni*Si=g(Ri))を求める。
これをg関数と称する。次に、このg関数に3段組用の
フィルタf3と2段組用のフィルタf2とを掛け合わせ
て合成関数h3(Ri)=f3(g(Ri))、h2
(Ri)=f3(g(Ri))をそれぞれ算出する。こ
れをh関数と称する。Next, the column classification will be described. For column classification, first, the frequency distribution in the x direction of each rectangular area,
That is, the existence frequency of the origin (for example, the upper left of the region) of the rectangular region in the x direction is checked, and the class value (representative value within a certain range) Ri in the x direction is multiplied by the product ni of the frequency ni and each region area Si.
The relationship with * Si (ni * Si = g (Ri)) is obtained.
This is called a g function. Next, the g function is multiplied by a filter f3 for three stages and a filter f2 for two stages to obtain a composite function h3 (Ri) = f3 (g (Ri)), h2
(Ri) = f3 (g (Ri)) is calculated. This is called an h function.
【0035】図11(a)は2段組用のフィルタの特
性、(b)は3段組用のフィルタの特性、(c)はこの
実施形態におけるg関数、(d)はh関数の説明図であ
る。図11(c),(d)の場合、縦軸が度数ni及び
個々の領域面積Siの積ni*Siであり、横軸がx方
向の座標となる。各度数niにそれぞれ領域面積Siを
乗算するのは、各度数niに重みを付与して文書画像中
のゴミ印字等を排除するためである。図11(d)に示
されるh関数は、結局、フィルタを通した場合のx方向
の度数分布と面積の積となる。そこで、全体の領域(統
合領域)の面積の総和Sに対するh関数の割合がどの程
度になるかによって段組の種類を判別する。段組みの種
類の判別は下式の条件を満足するか否かによって行う。
なお、判別の順序は、(4-1)式、(4-2)式の順に行う。FIG. 11A shows the characteristics of a two-stage filter, FIG. 11B shows the characteristics of a three-stage filter, FIG. 11C shows the g function in this embodiment, and FIG. 11D shows the h function. FIG. 11C and 11D, the vertical axis represents the product ni * Si of the frequency ni and the area of each region Si, and the horizontal axis represents the coordinates in the x direction. The reason for multiplying each frequency ni by the area area Si is to give weight to each frequency ni and eliminate dust printing or the like in the document image. The h function shown in FIG. 11D is, after all, a product of the frequency distribution in the x direction and the area when the light passes through the filter. Therefore, the type of the column is determined based on the ratio of the h function to the total area S of the entire area (integrated area). The determination of the type of the column is made based on whether or not the following condition is satisfied.
Note that the order of determination is performed in the order of Expression (4-1) and Expression (4-2).
【0036】[0036]
【数4】 (Equation 4)
【0037】次に、ユーザ定義分類について説明する。
図12は、ユーザが独自に定義するフォーマットの登録
手順の説明図である。スキャナ11より入力された文書
画像について単一属性の矩形領域を特定するのは上述の
文書認識処理部12の処理と同様である(ステップS2
1)。ここでは、特定した矩形領域について図13に示
されるような特徴ベクトルを抽出する(ステップS2
2)。そして、この特徴ベクトルによりフォーマット判
定用辞書を作成する(ステップS23)。このフォーマ
ット判定用辞書は、例えば文書データベース14に含め
ることも可能であるが、独立なユニットとして存在させ
てもよい。図13で示される特徴ベクトルVは、(V
1,V2,…,V53)(53は成分数)のように記述
され、特徴ベクトルの各成分は、文書認識処理の際に特
定された矩形領域全体についての特徴を表している。Next, the user-defined classification will be described.
FIG. 12 is an explanatory diagram of a registration procedure of a format uniquely defined by a user. Specifying a single-attribute rectangular area for a document image input from the scanner 11 is the same as the above-described processing of the document recognition processing unit 12 (step S2).
1). Here, a feature vector as shown in FIG. 13 is extracted for the specified rectangular area (step S2).
2). Then, a dictionary for format determination is created from the feature vector (step S23). The format determination dictionary can be included in, for example, the document database 14, but may exist as an independent unit. The feature vector V shown in FIG.
1, V2,..., V53) (53 is the number of components), and each component of the feature vector represents a feature of the entire rectangular area specified during the document recognition processing.
【0038】次に、フォーマット判定用辞書を用いてユ
ーザ定義によるフォーマットのカテゴリ判定の処理手順
を図14を参照して説明する。ユーザ定義によるフォー
マットのカテゴリ判定は、文書分類処理部13が行う。
文書分類処理部13は、まずスキャナ11に入力された
文書の文書画像について文書認識処理を行って単一の属
性をもつ矩形領域を特定する(ステップS31)。次に
特定された矩形領域に基づいて図13に示される特徴ベ
クトルV=(V1,V2,…,V53:53は成分数)
を抽出する(ステップS32)。さらに、フォーマット
のカテゴリが異なる文書の特徴ベクトルがより散らば
り、かつ同じカテゴリに属する文書の特徴ベクトルがよ
り近接して分布するような特徴空間を形成する変換行列
Mを求め、これを作用してできる新たな特徴ベクトルV
!=MVを定義する(ステップS33)。Next, a processing procedure for determining a category of a format defined by a user using a format determination dictionary will be described with reference to FIG. The category classification of the format defined by the user is performed by the document classification processing unit 13.
First, the document classification processing unit 13 performs a document recognition process on the document image of the document input to the scanner 11 to specify a rectangular area having a single attribute (step S31). Next, based on the specified rectangular area, a feature vector V = (V1, V2,..., V53: 53 is the number of components) shown in FIG.
Is extracted (step S32). Further, a transformation matrix M is formed which forms a feature space in which feature vectors of documents having different format categories are more scattered and feature vectors of documents belonging to the same category are more closely distributed. New feature vector V
! = MV is defined (step S33).
【0039】図15は特徴空間の一例を示しており、図
中の点は一つの文書についての特徴ベクトルを象徴して
いる。また、互いに近接する点集合の集まりがユーザが
予め定義したフォーマットが属するカテゴリA,B,C
に対応している。こうして、さらにステップS33で生
成された特徴ベクトルV!を特徴空間にマップして、カ
テゴリA,B,Cに含まれる特徴ベクトルとのユークリ
ッド距離を算出する(ステップS34)。特徴ベクトル
V!とカテゴリとの距離の定義の例として、特徴ベクト
ルV!とカテゴリに属する特徴ベクトルとの距離の平均
値、あるいは、最小値等をとることができる。FIG. 15 shows an example of a feature space. Points in the figure represent feature vectors for one document. Further, a set of point sets close to each other is classified into categories A, B, and C to which a format defined by the user belongs.
It corresponds to. Thus, the feature vector V! Is mapped to the feature space, and the Euclidean distance from the feature vectors included in the categories A, B, and C is calculated (step S34). Feature vector V! As an example of the definition of the distance between a category and a category, the feature vector V! The average value or the minimum value of the distances between the feature vector and the feature vector belonging to the category can be taken.
【0040】最後に、各カテゴリとの距離において、距
離が最も近く、かつ、その値がしきい値dよりも小さな
カテゴリが見つかれば、入力された文書のフォーマット
はそのカテゴリに属するものと判定される(ステップS
35)。入力された文書のフォーマットと既に存在する
カテゴリとの距離がいずれもしきい値dを越える場合
は、入力された文書のカテゴリを新しいカテゴリとして
登録する。Finally, if a category having the closest distance to each category and a value smaller than the threshold value d is found, the format of the input document is determined to belong to the category. (Step S
35). If the distance between the format of the input document and the existing category both exceeds the threshold value d, the category of the input document is registered as a new category.
【0041】このように、本実施形態による文書登録シ
ステムでは、スキャナ11から入力されたユーザ定義に
よる文書のフォーマットについて自動的にフォーマット
のカテゴリの判定が行われる。そして、入力された文書
の文書画像が判定されたカテゴリについての識別情報を
含む検索キーと共に文書用データベース14に登録され
る。この検索キーに基づいて文書データベース14の検
索が実行される。As described above, in the document registration system according to the present embodiment, the format category of the document defined by the user input from the scanner 11 is automatically determined. Then, the document image of the input document is registered in the document database 14 together with a search key including identification information on the determined category. A search of the document database 14 is executed based on the search key.
【0042】次に、文書登録システムの検索系の動作を
説明する。文書検索は、例えばLAN等に繋がったWW
Wクライアント端末18より検索キーを入力することに
より行われる。検索用アプリケーションは、市販のWW
Wブラウザを使用することができる。また、httpd
より検索用インターフェースが提供される。そして、例
えば「cgi−bin」を用い、データベースAPIを
通して文書データベース14から所望の文書画像を索出
する。このようにして、WWWクライアント端末18か
ら対話的に検索を実行してユーザの所望する文書を得る
ことができる。この場合の検索結果は、一般的に複数の
文書である。さらに、検索結果の文書数を考慮して検索
結果の文書数が少なくなったときに、ブラウジング(パ
ラパラめくり)により一気に文書画像を出力して参照す
ることができる。なお、検索された文書は、WWWクラ
イアント端末18のディスプレイに表示するか、あるい
はプリントアウトなどによって出力する。Next, the operation of the retrieval system of the document registration system will be described. Document search is, for example, a WW connected to a LAN or the like.
This is performed by inputting a search key from the W client terminal 18. Search application is a commercial WW
A W browser can be used. Also, httpd
A more search interface is provided. Then, a desired document image is retrieved from the document database 14 through the database API using, for example, “cgi-bin”. In this way, a search can be executed interactively from the WWW client terminal 18 to obtain a document desired by the user. The search result in this case is generally a plurality of documents. Further, when the number of documents in the search result is reduced in consideration of the number of documents in the search result, a document image can be output and referenced at a stretch by browsing (parallel flipping). The retrieved document is displayed on the display of the WWW client terminal 18 or output by printing out.
【0043】この文書登録システムでは、フォーマット
検索、キーワード検索、あるいは図/表名検索による三
種類の検索が可能である。フォーマット検索では、上述
した「文字的文書」、「表的文書」、「図的文書」、
「段無し」、「2段組」、「3段組」や、ユーザが定義
したフォーマットなどを検索キーとして、文書データベ
ース14に登録されている文書のフォーマット情報を参
照して文書の検索を行う。キーワード検索では、キーワ
ードを検索キーとして、文書データベース14に登録さ
れている文書の文字情報を参照して検索を行う。このと
き、市販の全文検索エンジンを使用してもよい。また、
図/表名検索では、図表に付与されている図題/表題を
検索キーとして検索を行うが、文書データベース14に
登録されている文書の図/表名情報を参照して、指定さ
れた題目を含む図/表が記載されている文書を検索す
る。In this document registration system, three types of searches by format search, keyword search, or figure / table name search are possible. In the format search, the "character document", "table document", "graphic document",
The document is searched by referring to the format information of the document registered in the document database 14 using “column-less”, “two-column”, “three-column” or a format defined by the user as a search key. . In the keyword search, a search is performed with reference to character information of a document registered in the document database 14 using a keyword as a search key. At this time, a commercially available full-text search engine may be used. Also,
In the figure / table name search, a search is performed using the figure / title given to the figure as a search key. The figure / table name information of the document registered in the document database 14 is referred to, and the designated title is designated. Search for documents in which figures / tables containing "" are described.
【0044】本実施形態による文書登録システムは、イ
ンターネットなどの広域ネットワークに接続された形態
をとっているが、必ずしもこうした形態を必要としな
い。例えば、文書登録と文書検索を実現するようにプロ
グラムされたパーソナルコンピュータに文書を取り込む
ためのスキャナと、検索結果を出力するためのディスプ
レイやプリンタなどが接続された実施形態も可能であ
る。以上、本発明を実施の形態を示して説明したが、本
発明は、上記実施の態様に限定されるものでないことは
勿論である。Although the document registration system according to the present embodiment has a form connected to a wide area network such as the Internet, such a form is not necessarily required. For example, an embodiment in which a scanner for taking in a document into a personal computer programmed to realize document registration and document search and a display or printer for outputting a search result are connected is also possible. As described above, the present invention has been described with reference to the embodiments. However, it is needless to say that the present invention is not limited to the above embodiments.
【0045】[0045]
【発明の効果】上述の説明から明らかなように、本発明
によれば、検索対象となる文書画像の入力、分類作業の
負担が軽減され、しかも高精度な検索が可能になる。し
たがって、実用的なファイリングシステムの構築、運用
が可能になり、事務処理のペーパーレス化が促進されて
書類保管スペースの確保が不要になる。As is apparent from the above description, according to the present invention, the burden of inputting and classifying document images to be searched can be reduced, and high-precision searching can be performed. Therefore, a practical filing system can be constructed and operated, and paperless office work is promoted, so that it is not necessary to secure a document storage space.
【図1】本発明の一実施形態による文書登録システムの
構成図。FIG. 1 is a configuration diagram of a document registration system according to an embodiment of the present invention.
【図2】本実施形態による文書認識処理部の基本的な機
能ブロックの構成図。FIG. 2 is a configuration diagram of basic functional blocks of a document recognition processing unit according to the embodiment.
【図3】本実施形態による文書画像上に存在する黒画素
の周辺分布図。FIG. 3 is a peripheral distribution diagram of black pixels existing on a document image according to the embodiment;
【図4】(a)は傾きのない文書画像上に存在する黒画
素の周辺分布図、(b)傾いた文書画像上に存在する黒
画素の周辺分布図。4A is a peripheral distribution diagram of black pixels existing on a document image having no inclination, and FIG. 4B is a peripheral distribution diagram of black pixels existing on an inclined document image.
【図5】本実施形態による文書画像の傾き補正角度算出
の説明図。FIG. 5 is an explanatory diagram of calculating a tilt correction angle of a document image according to the embodiment.
【図6】(a)は本実施形態による基本矩形領域の抽出
処理の説明図、(b)は本実施形態による基本矩形領域
の一例を示した図。FIG. 6A is a diagram illustrating a process of extracting a basic rectangular area according to the embodiment, and FIG. 6B is a diagram illustrating an example of the basic rectangular area according to the embodiment.
【図7】(a)本実施形態による基本矩形領域の統合ロ
ジックの説明図、(b)本実施形態による基本矩形領域
の他の統合ロジックの説明図。7A is an explanatory diagram of integrated logic of a basic rectangular area according to the embodiment, and FIG. 7B is an explanatory diagram of another integrated logic of the basic rectangular area according to the embodiment.
【図8】本実施形態による領域属性判別処理における処
理手順の説明図。FIG. 8 is an explanatory diagram of a processing procedure in a region attribute determination process according to the embodiment;
【図9】本実施形態による図表題識別処理における処理
手順の説明図。FIG. 9 is an explanatory diagram of a processing procedure in a figure title identification processing according to the embodiment;
【図10】本実施形態による文書認識処理後の文書画像
の一例を示した図。FIG. 10 is a view showing an example of a document image after the document recognition processing according to the embodiment.
【図11】(a)本実施形態による2段組のフィルタの
特性図、(b)は3段組のフィルタの特性図、(c)は
g関数の一例を示す図、(d)は(c)の場合のh関数
(合成関数)の一例を示した図。11A is a characteristic diagram of a two-stage filter according to the present embodiment, FIG. 11B is a characteristic diagram of a three-stage filter, FIG. 11C is a diagram showing an example of a g function, and FIG. The figure which showed an example of the h function (synthesis function) in the case of c).
【図12】本実施形態によるユーザ定義によるフォーマ
ット登録処理における処理手順の説明図。FIG. 12 is an explanatory diagram of a processing procedure in a user-defined format registration process according to the embodiment;
【図13】本実施形態による特徴ベクトルの定義の一例
を示した図。FIG. 13 is a view showing an example of the definition of a feature vector according to the embodiment.
【図14】本実施形態によるユーザ定義によるフォーマ
ット判定処理における処理手順の説明図。FIG. 14 is an explanatory diagram of a processing procedure in a format determination process according to a user definition according to the embodiment;
【図15】本実施形態による特徴空間の一例を示した
図。FIG. 15 is a view showing an example of a feature space according to the embodiment;
【図16】従来技術による文書登録システムにおける登
録画面の一例を示した図。FIG. 16 is a diagram showing an example of a registration screen in a conventional document registration system.
1 サーバ 10 入力文書 11 スキャナ 12 文書認識処理部 13 文書分類処理部 14 文書データベース 15 API 16 httpd 17 LAN 18 WWWクライアント端末 121 画像正規化部 122 基本矩形抽出部 123 領域統合部 124 領域属性判別部 125 文字認識部 1 Server 10 Input Document 11 Scanner 12 Document Recognition Processing Unit 13 Document Classification Processing Unit 14 Document Database 15 API 16 http 17 LAN 18 WWW Client Terminal 121 Image Normalization Unit 122 Basic Rectangle Extraction Unit 123 Area Integration Unit 124 Area Attribute Discrimination Unit 125 Character recognition unit
───────────────────────────────────────────────────── フロントページの続き (72)発明者 塚本 英昭 東京都江東区豊洲三丁目3番3号 エヌ・ ティ・ティ・データ通信株式会社内 ──────────────────────────────────────────────────の Continuing on the front page (72) Inventor Hideaki Tsukamoto 3-3-3 Toyosu, Koto-ku, Tokyo NTT Data Communications Corporation
Claims (9)
する検索キーと共にデータベースに登録する文書登録手
段を備え、前記検索キーに基づいて登録済みの文書画像
を検索する文書登録システムにおいて、 前記文書登録手段は、 前記文書画像上の文字領域、表領域、図領域などの属性
別領域及びその位置情報を特定する文書認識処理部を有
し、 この特定した属性別領域の属性及び位置情報を含んで前
記検索キーを自動生成することを特徴とする文書登録シ
ステム。1. A document registration system comprising: document registration means for registering an input document image in a database together with a search key corresponding to the document image; and searching for a registered document image based on the search key. The document registration unit has a document recognition processing unit that specifies attribute-based areas such as a character area, a table area, and a figure area on the document image, and position information thereof, and stores the attribute and position information of the specified attribute-based area. A document registration system for automatically generating the search key.
傾いている場合にその傾き補正を行う画像正規化部、前
記文書画像または傾き補正がなされた文書画像から基本
矩形領域の抽出を行う基本矩形領域抽出部、抽出された
基本矩形領域を必要に応じて統合する領域統合部、基本
矩形領域または統合された領域が文字、図、表等のいず
れの属性に該当するかを判別する領域属性判別部を有す
ることを特徴とする請求項1記載の文書登録システム。2. The image recognition processing unit according to claim 1, wherein the document image processing unit corrects the inclination of the document image when the document image is inclined, and extracts a basic rectangular area from the document image or the document image subjected to the inclination correction. A basic rectangular area extracting unit, an area integrating unit that integrates the extracted basic rectangular areas as necessary, and an area for determining whether the basic rectangular area or the integrated area corresponds to a character, a figure, a table, or any other attribute. 2. The document registration system according to claim 1, further comprising an attribute determination unit.
ける行方向及び列方向の各画素周辺分布を検出し、各方
向の白分布が最大になるように当該文書画像を回転させ
ることを特徴とする請求項2記載の文書登録システム。3. The image normalizing unit detects a peripheral distribution of each pixel in a row direction and a column direction in the document image, and rotates the document image such that a white distribution in each direction is maximized. The document registration system according to claim 2, wherein
に含まれる基本矩形領域の幅と高さの分散、及び各領域
内の線分の数とその長さを求め、各分散の値、線分の
数、及び線分長に応じて当該領域の属性が、文字、表、
図のいずれであるかを判別することを特徴とする請求項
2記載の文書登録システム。4. The area attribute determining unit obtains the variance of the width and height of the basic rectangular area included in the integrated area, the number of line segments in each area and the length thereof, and calculates the value of each variance. , The number of line segments, and the attribute of the region according to the length of the line segments, characters, tables,
3. The document registration system according to claim 2, wherein one of the figures is determined.
た注目領域の近隣の領域からの位置ずれ量を算出し、こ
の位置ずれ量が規定値以下のときに当該注目領域を前記
近隣の領域の題表示領域と判定することを特徴とする請
求項4記載の文書登録システム。5. The region attribute determining unit calculates a positional shift amount of a region of interest determined as a character from a region near the target region. 5. The document registration system according to claim 4, wherein the region is determined to be a title display region.
する検索キーと共にデータベースに登録する文書登録手
段を備え、前記検索キーに基づいて登録済みの文書画像
を検索する文書登録システムにおいて、 前記文書登録手段は、 前記文書画像上の文字領域、表領域、図領域などの属性
別領域及びその位置情報を特定する文書認識処理部と、 特定された属性別領域及びその位置情報に基づいて文書
フォーマットによる分類を行う文書分類処理部とを有
し、 この分類結果を前記検索キーに含ませることを特徴とす
る文書登録システム。6. A document registration system, comprising: document registration means for registering an input document image in a database together with a search key corresponding to the document image, wherein the document registration system searches for a registered document image based on the search key. The document registration unit includes: a document recognition processing unit that specifies an attribute-based area such as a character area, a table area, and a figure area on the document image and its position information; and a document based on the specified attribute-based area and its position information. A document registration system, comprising: a document classification processing unit for performing classification by format; and including the classification result in the search key.
理部で認識された属性別領域の属性の数に基づいて、当
該文書画像を文字主体の「文字的文書」、表主体の「表
的文書」、図主体の「図的文書」などの一般的文書種別
に分類することを特徴とする請求項6記載の文書登録シ
ステム。7. The document classification processing unit, based on the number of attributes in the attribute-based area recognized by the document recognition processing unit, the document image is a “character document” mainly composed of characters, and a “table document” composed mainly of tables. 7. The document registration system according to claim 6, wherein the document registration system is classified into general document types such as "graphic documents" and "graphic documents" mainly composed of graphics.
る前記基本矩形領域または統合領域の存在頻度及び個々
の領域の面積の関数に基づいて当該文書画像の段組の種
類を判別し、判別された段組別に前記文書画像を分類す
ることを特徴とする請求項6記載の文書登録システム。8. The document classification processing unit determines the type of a column of the document image based on a function of the frequency of existence of the basic rectangular area or the integrated area in a predetermined direction and the area of each area. 7. The document registration system according to claim 6, wherein the document images are classified according to columns.
理部で認識された属性別領域の属性及び位置情報に基づ
いて文書画像の文書特徴を表す特徴ベクトルを生成する
特徴ベクトル生成手段と、予め生成した複数の特徴ベク
トルをそれぞれ文書フォーマット別にグループ分けして
格納した辞書部と、前記特徴ベクトル生成手段が生成し
た特徴ベクトルと前記辞書部に格納された各特徴ベクト
ルとの距離を比較して、該距離がより小さい特徴ベクト
ルの属する一つのグループを特定するグループ特定手段
とを有し、この特定されたグループ別に前記文書画像を
分類することを特徴とする請求項6記載の文書登録シス
テム。9. A feature vector generation unit configured to generate a feature vector representing a document feature of a document image based on attribute and position information of an attribute-based area recognized by the document recognition processing unit, A dictionary unit in which a plurality of feature vectors generated in advance are grouped for each document format and stored, and a distance between a feature vector generated by the feature vector generation unit and each feature vector stored in the dictionary unit are compared. 7. The document registration system according to claim 6, further comprising group specifying means for specifying one group to which the feature vector having the smaller distance belongs, and classifying the document image according to the specified group.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8164855A JPH1011459A (en) | 1996-06-25 | 1996-06-25 | Document registration system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8164855A JPH1011459A (en) | 1996-06-25 | 1996-06-25 | Document registration system |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH1011459A true JPH1011459A (en) | 1998-01-16 |
Family
ID=15801203
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP8164855A Pending JPH1011459A (en) | 1996-06-25 | 1996-06-25 | Document registration system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH1011459A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000137728A (en) * | 1998-11-02 | 2000-05-16 | Fujitsu Ltd | Document analyzing device and program recording medium |
JP2005316813A (en) * | 2004-04-30 | 2005-11-10 | Konica Minolta Business Technologies Inc | Image processing method, image processing program, and image processor |
-
1996
- 1996-06-25 JP JP8164855A patent/JPH1011459A/en active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000137728A (en) * | 1998-11-02 | 2000-05-16 | Fujitsu Ltd | Document analyzing device and program recording medium |
JP2005316813A (en) * | 2004-04-30 | 2005-11-10 | Konica Minolta Business Technologies Inc | Image processing method, image processing program, and image processor |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7031555B2 (en) | Perceptual similarity image retrieval | |
US5822454A (en) | System and method for automatic page registration and automatic zone detection during forms processing | |
JP7013182B2 (en) | Information processing equipment, information processing methods and programs | |
US7460710B2 (en) | Converting digital images containing text to token-based files for rendering | |
US5721940A (en) | Form identification and processing system using hierarchical form profiles | |
JP5659563B2 (en) | Identification method, identification device, and computer program | |
US6169998B1 (en) | Method of and a system for generating multiple-degreed database for images | |
US7403657B2 (en) | Method and apparatus for character string search in image | |
US6621941B1 (en) | System of indexing a two dimensional pattern in a document drawing | |
EP0854433A2 (en) | Caption and photo extraction from scanned document images | |
US20090106699A1 (en) | Image processing device and image processing method | |
US6321232B1 (en) | Method for creating a geometric hash tree in a document processing system | |
WO2007022460A2 (en) | Post-ocr image segmentation into spatially separated text zones | |
JP2001175807A (en) | Method for selecting text area | |
JP2009020889A (en) | Method and system for retrieving electronic document | |
US20130198173A1 (en) | Image processing apparatus, image processing method, and computer-readable storage medium | |
JPH01253077A (en) | Detection of string | |
JP2008217833A (en) | Document image recognition system and storage medium for document image recognition program | |
JP4859054B2 (en) | Image processing apparatus, image processing method, program, and recording medium | |
JP2019153919A (en) | Image processing device, control method thereof, and program | |
JP3471578B2 (en) | Line direction determining device, image tilt detecting device, and image tilt correcting device | |
Stamatopoulos et al. | Page frame detection for double page document images | |
JPH1011459A (en) | Document registration system | |
CN111241955B (en) | Bill information extraction method and system | |
JP2005208977A (en) | Document filing device and method |