JP2001109843A - Method and device for character recognition - Google Patents

Method and device for character recognition

Info

Publication number
JP2001109843A
JP2001109843A JP28951399A JP28951399A JP2001109843A JP 2001109843 A JP2001109843 A JP 2001109843A JP 28951399 A JP28951399 A JP 28951399A JP 28951399 A JP28951399 A JP 28951399A JP 2001109843 A JP2001109843 A JP 2001109843A
Authority
JP
Japan
Prior art keywords
cell
information
item
data
row
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP28951399A
Other languages
Japanese (ja)
Other versions
JP3435375B2 (en
Inventor
Katsuhiko Aoki
勝彦 青木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP28951399A priority Critical patent/JP3435375B2/en
Publication of JP2001109843A publication Critical patent/JP2001109843A/en
Application granted granted Critical
Publication of JP3435375B2 publication Critical patent/JP3435375B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To perform character recognition corresponding to a cell structure by properly recognizing the cell structure from a document format which has one item represented by more than one cell and one set of data represented by more than one cell. SOLUTION: A character recognition system performs cell extraction for extracting the minimum unit of an area encircled with ruled lines, etc., as a cell from image data obtained by reading an image out of a document, etc., specifies item rows and data rows by arraying respective cells in the row and column directions and also generates table cell structure data showing the structure of the respective cells, the relation between cells, etc., and performs a recognizing process for the cells according to the table cell structure data.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、文字画像を認識し
て、文字画像に応じた文字情報を生成する文字認識方法
および装置に係り、たとえば、表形式にて記述された帳
票を読み取って、表構造および文字に対する認識を行う
文字認識方法および装置に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character recognition method and apparatus for recognizing a character image and generating character information corresponding to the character image, for example, by reading a form described in a table format. The present invention relates to a character recognition method and apparatus for recognizing a table structure and characters.

【0002】[0002]

【従来の技術】近年、紙などに記録された文字画像を読
み取って対応する文字コードを出力することにより、文
字を高速に入力する文字認識技術が知られている。この
ような認識技術を採用したOCR (Optical Character Rea
der)は、汎用のコンピュータ装置に導入されたソフトウ
ェアや専用装置によって構成されて、様々な文字を認識
することができる。最近のOCR は、手書き文字、英数・
カタカナ(ANK) 文字、漢字および欧文活字を認識対象と
して処理するのみならず、それらのレイアウトや表組み
状態をも認識して、認識対象の状態に応じた書式のコー
ドデータを生成できるようになり、さらに、様々な様式
の認識対象を精度よく認識することが望まれている。
2. Description of the Related Art In recent years, there has been known a character recognition technique for inputting characters at high speed by reading a character image recorded on paper or the like and outputting a corresponding character code. OCR (Optical Character Rea
der) is constituted by software installed in a general-purpose computer device or a dedicated device, and can recognize various characters. Recent OCRs include handwriting, alphanumeric
In addition to processing Katakana (ANK) characters, kanji, and Western characters as recognition targets, it can also recognize the layout and tabular state of them and generate code data in a format according to the recognition target state. Further, it is desired to accurately recognize recognition targets of various styles.

【0003】たとえば、一般帳票として、罫線等にて囲
まれた表形式の一般帳票に対して、文字認識処理を行う
際には、罫線にて囲まれる項目の領域をセルとして取り
扱い、各セル内における文字を認識するものであった。
たとえば、特許第2740335 号の特許公報には、自動セル
属性判定機能を有する表読取装置装置が開示されてい
る。この公報に記載の発明では、罫線で囲まれたセル内
の文字を読み取る際、数字・記号や書式等のセル内文字
内容に関するセル属性を自動的に判定し、セル属性に応
じた文字認識処理を行うことにより文字認識率を向上さ
せるというものであった。
For example, when performing character recognition processing on a general form in a tabular form surrounded by a ruled line or the like as a general form, the area of the item surrounded by the ruled line is treated as a cell, and Was recognized.
For example, Japanese Patent No. 2740335 discloses a table reader having an automatic cell attribute determination function. According to the invention described in this publication, when reading a character in a cell surrounded by a ruled line, a cell attribute relating to the character content in the cell such as a number, a symbol, and a format is automatically determined, and a character recognition process corresponding to the cell attribute is performed. Is performed to improve the character recognition rate.

【0004】[0004]

【発明が解決しようとする課題】しかしながら、従来の
表読み取り機能で的確に読みとれる表形式は、一つの項
目が一つのセルで表されており、また、項目に対応する
データがその項目の真下に一つのセルにて表されている
場合であった。
However, in the table format which can be read accurately by the conventional table reading function, one item is represented by one cell, and data corresponding to the item is directly below the item. Was represented by one cell.

【0005】しかし、文書のレイアウト構造には様々な
ものがあり、たとえば、罫線等にて表組みされた帳票に
記録されている文字を認識する際に、項目やデータのセ
ルが複数のセルにて構成されている表については、表形
式に応じた文字認識を精度よく行うことは困難であっ
た。
However, there are various document layout structures. For example, when recognizing a character recorded on a form tabulated by a ruled line or the like, an item or data cell is divided into a plurality of cells. It is difficult to accurately perform character recognition in accordance with the table format for a table configured as described above.

【0006】たとえば、項目のセルを複数のセルで構成
した表形式の場合や、1つのデータのセルが複数セルに
て構成されている表形式の場合には、表形式を的確に判
断することができなかった。このため、たとえば、密接
に関連する各領域がそれぞれ無関係な領域として処理さ
れてしまう。この結果、本来同一行であるものが複数行
として認識されてしまったり、同一項目や一つのセル内
容であるにもかかわらず複数のセルとして認識されてし
まうという問題があった。
For example, in the case of a table format in which an item cell is composed of a plurality of cells, or in the case of a table format in which one data cell is composed of a plurality of cells, it is necessary to accurately determine the table format. Could not. Therefore, for example, each of the closely related areas is processed as an unrelated area. As a result, there is a problem that a line which is originally the same line is recognized as a plurality of lines, or a plurality of cells are recognized despite the same item or one cell content.

【0007】本発明はこのような従来技術の欠点を解消
し、表組みされた各領域のセル構造を高精度に認識し、
たとえば、複数セルで一つの項目を表されたり、複数セ
ルで一組のデータを表されたりした帳票形式から、セル
構造を適切に認識し、セル構造に応じた文字認識処理を
行うことができる文字認識方法および装置を提供するこ
とを目的とする。
The present invention solves the above-mentioned drawbacks of the prior art, and recognizes the cell structure of each tabulated area with high accuracy.
For example, it is possible to appropriately recognize a cell structure from a form in which one item is represented by a plurality of cells or a set of data is represented by a plurality of cells, and perform character recognition processing according to the cell structure. It is an object to provide a character recognition method and apparatus.

【0008】[0008]

【課題を解決するための手段】本発明は上述の課題を解
決するために、情報記録媒体に記録された画像を読み取
って得られるイメージ情報に応じて、イメージ情報に対
応する文字情報を認識する文字認識方法において、この
方法は、イメージ情報を入力する入力工程と、イメージ
情報から罫線にて囲まれる表領域における最小単位のセ
ルを抽出し、セルの位置を表す座標情報を各セルごとに
生成するセル抽出工程と、表領域の構造を各セルを整列
させて特定し、構造を表す整列情報を生成する表整列工
程と、座標情報および整列情報に基づいて、セルに対応
するイメージデータから文字情報を認識する認識工程
と、認識工程にて認識される文字情報を出力する認識結
果出力工程とを含み、表整列工程は、行方向の整列処理
と列方向の整列処理とを行って、各セル間の関係を表す
整列情報を各セルについてそれぞれ生成することを特徴
とする。
In order to solve the above-mentioned problems, the present invention recognizes character information corresponding to image information in accordance with image information obtained by reading an image recorded on an information recording medium. In the character recognition method, this method includes inputting image information, extracting a minimum unit cell in a table area surrounded by ruled lines from the image information, and generating coordinate information representing a cell position for each cell. A cell extraction step, a table area alignment step of identifying the structure of the table area by aligning each cell, and generating alignment information representing the structure; and a text from image data corresponding to the cell based on the coordinate information and the alignment information. A table recognizing step including a recognition step of recognizing information and a recognition result outputting step of outputting character information recognized in the recognizing step; The go, characterized in that the alignment information indicative of a relation between the cells each generate for each cell.

【0009】この場合、表整列工程は、行方向の整列処
理を行う際、表領域における項目を表す項目セルと、項
目セルによる項目行とを特定し、列方向の整列処理に
て、項目行の各項目セルに対応するデータ行におけるデ
ータセルを特定する情報を整列情報に記述するとよい。
In this case, in the table sorting step, when performing row-direction sorting, an item cell representing an item in the table area and an item row by the item cell are specified, and the item row is determined in the column-direction sorting process. The information for specifying the data cell in the data row corresponding to each item cell may be described in the alignment information.

【0010】この場合さらに、表整列工程は、各データ
セルにそれぞれ対応するデータセルを特定する情報を整
列情報に記述するとよい。
In this case, in the table sorting step, information for specifying a data cell corresponding to each data cell may be described in the sorting information.

【0011】また、表整列工程は、項目行における項目
セルの入れ子状態を認識する工程と、認識した入れ子状
態に応じて、入れ子状態の項目セルを表す複合セルを作
成する工程とを含み、認識工程は、複合セルに対応する
データセルについて文字情報を認識するとよい。
The table sorting step includes a step of recognizing the nested state of the item cells in the item row, and a step of creating a composite cell representing the nested item cell according to the recognized nested state. In the step, character information may be recognized for a data cell corresponding to the composite cell.

【0012】また、表整列工程は、データ行におけるデ
ータセルを項目セルの幅に応じて結合して結合セルを作
成する工程を含み、認識工程は、結合セルに対応する各
データセルについて文字情報を認識するとよい。
The table sorting step includes a step of combining data cells in a data row in accordance with the width of the item cell to form a combined cell. The recognizing step includes a step of combining character information for each data cell corresponding to the combined cell. Should be recognized.

【0013】また、表整列工程は、項目行における項目
セルの入れ子状態を認識する工程と、認識した入れ子状
態に応じて、入れ子状態の項目セルに対応するデータセ
ルを項目セルの幅に応じて特定する工程とを含み、認識
工程は、特定されるデータセルについて文字情報を認識
するとよい。
The table sorting step includes a step of recognizing the nesting state of the item cells in the item row, and, in accordance with the recognized nesting state, changing a data cell corresponding to the nested item cell in accordance with the width of the item cell. The identifying step may include recognizing character information for the identified data cell.

【0014】また、本発明は上述の課題を解決するため
に、情報記録媒体に記録された画像を読み取って得られ
るイメージ情報に応じて、イメージ情報に対応する文字
情報を認識する文字認識装置において、この装置は、イ
メージ情報を入力する入力手段と、イメージ情報から罫
線にて囲まれる表領域における最小単位のセルを抽出
し、セルの位置を表す座標情報を各セルごとに生成する
セル抽出手段と、表領域の構造を各セルを整列させて特
定し、構造を表す整列情報を生成する表整列手段と、座
標情報および整列情報に基づいて、セルに対応するイメ
ージデータから文字情報を認識する認識手段と、認識工
程にて認識される文字情報を出力する認識結果出力手段
とを含み、表整列手段は、列方向の整列処理と行方向の
整列処理とを行って、各セル間の関係を表す整列情報を
各セルについてそれぞれ生成することを特徴とする。
According to another aspect of the present invention, there is provided a character recognition apparatus for recognizing character information corresponding to image information in accordance with image information obtained by reading an image recorded on an information recording medium. An input unit for inputting image information; and a cell extracting unit for extracting a minimum unit cell in a table area surrounded by a ruled line from the image information and generating coordinate information indicating a cell position for each cell. And a table aligning means for identifying the structure of the table area by aligning the cells and generating alignment information representing the structure, and recognizing character information from image data corresponding to the cells based on the coordinate information and the alignment information. A recognition unit that includes a recognition result output unit that outputs character information recognized in the recognition step, wherein the table alignment unit performs a column direction alignment process and a row direction alignment process. The alignment information indicative of a relation between the cells and generates respectively for each cell.

【0015】この場合、表整列手段は、行方向の整列処
理を行う際、表領域における項目を表す項目セルと、項
目セルによる項目行とを特定し、列方向の整列処理に
て、項目行の各項目セルに対応するデータ行におけるデ
ータセルを特定する情報を整列情報に記述するとよい。
In this case, the table sorting means specifies the item cells representing the items in the table area and the item rows by the item cells when performing the row direction sorting process, and performs the item row by the column direction sorting process. The information for specifying the data cell in the data row corresponding to each item cell may be described in the alignment information.

【0016】この場合さらに表整列手段は、各データセ
ルにそれぞれ対応するデータセルを特定する情報を整列
情報に記述するとよい。
In this case, it is preferable that the table sorting means further describes information for specifying the data cell corresponding to each data cell in the sorting information.

【0017】また、表整列手段は、項目行における項目
セルの入れ子状態を認識する手段と、認識した入れ子状
態に応じて、入れ子状態の項目セルを表す複合セルを作
成する手段とを含み、認識手段は、複合セルに対応する
データセルについて文字情報を認識するとよい。
The table sorting means includes means for recognizing the nested state of the item cells in the item row, and means for creating a composite cell representing the nested item cells according to the recognized nested state. The means may recognize the character information for the data cell corresponding to the composite cell.

【0018】また、表整列手段は、データ行におけるデ
ータセルを項目セルの幅に応じて結合して結合セルを作
成する手段を含み、認識手段は、結合セルに対応する各
データセルについて文字情報を認識するとよい。
The table sorting means includes means for combining data cells in a data row in accordance with the width of an item cell to create a combined cell, and the recognizing means includes character information for each data cell corresponding to the combined cell. Should be recognized.

【0019】また、表整列手段は、項目行における項目
セルの入れ子状態を認識する手段と、認識した入れ子状
態に応じて、入れ子状態の項目セルに対応するデータセ
ルを項目セルの幅に応じて特定する手段とを含み、認識
手段は、特定されるデータセルについて文字情報を認識
するとよい。
The table sorting means includes means for recognizing the nested state of the item cells in the item row, and, in accordance with the recognized nested state, data cells corresponding to the nested item cells in accordance with the width of the item cells. And a recognizing means for recognizing character information for the specified data cell.

【0020】[0020]

【発明の実施の形態】次に添付図面を参照して本発明に
よる文字認識方法および装置の実施例を詳細に説明す
る。図3を参照すると、本実施例における文字認識シス
テム10が示され、このシステム10は、たとえば、図4に
示すような表形式にて表された帳票400等の情報記録媒
体に記録されたイメージを読み取って、その表構造およ
び記載文字を適切に認識し、認識結果に応じて帳票400
を表すコードデータを生成する表読取機能を有するシス
テムである。本実施例における帳票400 の項目行402 に
は、振込先、預金種目、口座番号、受取人名および金額
の各欄が記述されており、振込先欄はさらに銀行名と支
店名とが上下2段に分けられている。これら各欄は、実
線等の罫線でそれぞれ囲まれる領域にて示され、この項
目行以下の各行には、各項目に応じたデータが記述され
るデータ行404 がそれぞれ罫線に囲まれて配置されてい
る。この例ではデータ行404 の先頭行には、データ11
データ15が記述される領域がそれぞれ形成され、このよ
うなデータ行がデータ81〜データ85の最終行にわたって
配置されている。システム10は、このような帳票400 に
記述された表の構造および文字情報を的確に解析して認
識し、これら情報に応じた罫線コード、文字コードおよ
び書式情報を生成する。なお、以下の説明において本発
明に直接関係のない部分は、図示およびその説明を省略
し、また、信号の参照符号はその現われる接続線の参照
番号で表わす。
BRIEF DESCRIPTION OF THE DRAWINGS FIG. 1 is a block diagram of a character recognition method and apparatus according to the present invention. Referring to FIG. 3, there is shown a character recognition system 10 according to the present embodiment. The system 10 includes, for example, an image recorded on an information recording medium such as a form 400 shown in a table form as shown in FIG. , And recognizes the table structure and the written characters appropriately, and forms 400 according to the recognition result.
This is a system having a table reading function of generating code data representing the following. In the item row 402 of the form 400 according to the present embodiment, each column of a transfer destination, a deposit type, an account number, a recipient name and an amount is described, and the transfer destination column further includes a bank name and a branch name in two columns. Are divided into Each of these fields is indicated by an area surrounded by a ruled line such as a solid line. In each line below this item line, a data line 404 in which data corresponding to each item is described is arranged surrounded by a ruled line. ing. In this example, the first row of data row 404 contains data 11 to
An area in which data 15 is described is formed, and such data rows are arranged over the last rows of data 81 to data 85 . The system 10 accurately analyzes and recognizes the structure and character information of the table described in the form 400, and generates ruled line codes, character codes, and format information according to the information. In the following description, parts not directly related to the present invention are not shown and described, and reference numerals of signals are represented by reference numerals of connection lines in which the signals appear.

【0021】図3に戻って、画像入力装置302 は、紙な
どのシート状の帳票400 に印刷および印字された画像を
読み取って、そのイメージデータを出力304 に出力する
イメージスキャナである。画像入力装置302 は、帳票40
0 に記録された文字や図形などを光学的に読み取り、RG
B カラーまたはモノクロ等の画像情報を生成し、生成し
た画像情報をディジタル形式のイメージデータに変換し
て出力304 に出力する。
Returning to FIG. 3, the image input device 302 is an image scanner that reads an image printed and printed on a sheet form 400 such as paper and outputs the image data to an output 304. The image input device 302
Optically read characters and figures recorded in 0
B: Generates color or monochrome image information, converts the generated image information into digital image data, and outputs it to an output 304.

【0022】画像入力装置302 の出力304 は、コンピュ
ータ装置306 に接続され、コンピュータ装置306 は、入
力されるイメージデータから、文字種類および表構造を
認識して、認識結果に応じたコードデータを生成する処
理装置である。コンピュータ装置306 には、キーボード
308 やマウス310 等の入力装置と、処理画面や処理結果
等を表示する表示装置312 と、所望の情報をプリント出
力するプリンタ314 とがそれぞれ接続されている。
An output 304 of the image input device 302 is connected to a computer device 306. The computer device 306 recognizes a character type and a table structure from the input image data and generates code data corresponding to the recognition result. Processing device. Computer device 306 has a keyboard
An input device such as a mouse 308 and a mouse 310, a display device 312 for displaying a processing screen and a processing result, and a printer 314 for printing out desired information are connected to each other.

【0023】コンピュータ装置306 にはさらに、イメー
ジデータを所定の伝送形式にて送受信するモデムを有す
るファクシミリ装置316 が接続線318 を介して接続さ
れ、電話回線および通信回線等のライン320 を介して相
手先より送信されるイメージデータを受信してコンピュ
ータ装置306 に記憶させる。コンピュータ装置306 は、
記憶されたイメージデータ318 に対しても、画像入力装
置302 からの出力データ304 と同様にして表および文字
に対する認識処理を行う。
A facsimile apparatus 316 having a modem for transmitting and receiving image data in a predetermined transmission format is connected to the computer apparatus 306 via a connection line 318, and is connected via a line 320 such as a telephone line and a communication line. The image data transmitted from the destination is received and stored in the computer device 306. The computer device 306
The stored image data 318 is also subjected to recognition processing for tables and characters in the same manner as the output data 304 from the image input device 302.

【0024】本実施例におけるコンピュータ装置306
は、入力304 および入力318 に入力されるイメージデー
タを、アプリケーションプログラムに従う手順にて処理
し、その処理結果をファイルしたり、表示およびプリン
ト出力する機能を有する汎用のコンピュータである。コ
ンピュータ装置306 には、各接続機器に対する制御およ
び情報の授受を行う基本プログラムが導入されて、汎用
の情報処理機能および周辺機器に対する制御機能が備え
られている。さらに、コンピュータ装置306 には、画像
入力機能、文字認識機能および認識結果出力機能を実現
するための認識処理プログラムが不図示の記憶装置に導
入されており、コンピュータ装置306 は、これらプログ
ラムを主記憶に読み込んでこれらプログラムに応じた制
御および処理を行う。なお、このコンピュータ装置306
に導入される認識処理プログラムは、不図示の光ディス
クなどの記録媒体やサーバー等に記録され、これから読
み取ったプログラムデータがコンピュタ装置306 内の記
憶装置に格納されて、使用可能に導入される。
The computer 306 in this embodiment
Is a general-purpose computer having a function of processing image data input to the input 304 and the input 318 according to a procedure according to an application program, filing the processing result, and displaying and printing out. The computer device 306 is provided with a general-purpose information processing function and a control function for peripheral devices in which a basic program for controlling and transmitting / receiving information to / from each connected device is introduced. Further, a recognition processing program for realizing an image input function, a character recognition function, and a recognition result output function is installed in a storage device (not shown) in the computer device 306, and the computer device 306 stores these programs in a main storage. And performs control and processing according to these programs. This computer device 306
Is recorded on a recording medium such as an optical disk (not shown), a server, or the like, and the program data read therefrom is stored in a storage device in the computer device 306 and is introduced to be usable.

【0025】なお、接続線318 を介して接続されるファ
クシミリ装置316 がファクシミリ伝送機能を有するモデ
ムである場合には、コンピュータ装置306 は、導入され
ている通信ソフトウェアに応じた手順にてファクシミリ
伝送を行って、受信データを記憶する。コンピュタ装置
306 は、この受信データを伸張してイメージデータを再
生し、再生されたイメージデータに対して、文字および
帳票の認識処理を行う。
When the facsimile apparatus 316 connected via the connection line 318 is a modem having a facsimile transmission function, the computer apparatus 306 performs facsimile transmission according to the procedure according to the installed communication software. Go and store the received data. Computer equipment
306 decompresses the received data to reproduce the image data, and performs a character and form recognition process on the reproduced image data.

【0026】このようなコンピュータ装置306 の機能構
成を図2に示した機能ブロック図を参照して説明する
と、コンピュータ装置306 は、キーボード308 やマウス
310 が接続される入力部200 と、処理結果を出力する出
力部202 とを備え、これら入力部200 および出力部202
は、バス204 を介して制御部220 に接続されている。
The functional configuration of the computer device 306 will be described with reference to the functional block diagram shown in FIG.
An input unit 200 to which the processing unit 310 is connected and an output unit 202 for outputting a processing result are provided.
Are connected to the control unit 220 via the bus 204.

【0027】画像入力部206 は、画像入力装置302 およ
びファクシミリ装置316 から出力されるイメージデータ
304,318 を入力し、イメージデータを文字認識に適合す
る形式の白黒画像を表す2値データおよびファイル形式
に変換する機能を有する。画像入力部206 は、変換した
2値データをバス204 に出力して、画像メモリ208 に格
納させる。なお、あらかじめ2値画像のイメージデータ
が画像入力部206 に入力される場合には、画像入力部20
6 は、そのイメージデータを画像メモリ208 に格納させ
る。
An image input unit 206 stores image data output from the image input device 302 and the facsimile device 316.
304, 318, and has a function of converting image data into binary data representing a monochrome image in a format compatible with character recognition and a file format. The image input unit 206 outputs the converted binary data to the bus 204 and stores it in the image memory 208. When image data of a binary image is input to the image input unit 206 in advance, the image input unit 20
6 causes the image data to be stored in the image memory 208.

【0028】バス204 に接続された画像メモリ208 は、
入力304 または入力318 に入力される複数枚の帳票400
から読み取られたイメージデータを格納する記憶領域を
有する。画像メモリ208 に格納されたイメージデータ
は、制御部220 の制御に応動してバス204 に読み出さ
れ、読み出されたイメージデータは、帳票400 に記録さ
れた表セル構造を特定する際には、セル抽出部210 に入
力され、文字認識段階では認識部216 に入力される。
The image memory 208 connected to the bus 204
Multiple forms 400 entered in input 304 or input 318
It has a storage area for storing image data read from the. The image data stored in the image memory 208 is read out to the bus 204 in response to the control of the control unit 220, and the read out image data is used to specify the table cell structure recorded in the form 400. Are input to the cell extracting unit 210, and are input to the recognizing unit 216 in the character recognition stage.

【0029】セル抽出部210 は、画像メモリ208 に格納
されたイメージデータから、罫線にて囲まれた領域をセ
ルとして抽出する機能部である。セル抽出部210 は、抽
出されたセルの位置を示す座標情報を生成し、生成した
座標情報を表セル情報メモリ214 に格納させる。
The cell extracting section 210 is a functional section for extracting, from the image data stored in the image memory 208, an area surrounded by ruled lines as cells. The cell extracting unit 210 generates coordinate information indicating the position of the extracted cell, and stores the generated coordinate information in the table cell information memory 214.

【0030】詳しくは、セル抽出部210 は、帳票400 に
おけるイメージデータの水平(行)方向および垂直
(列)方向について走査して、水平方向に連続する黒デ
ータと水平方向に連続する黒データとを抽出する。セル
抽出部210 は、抽出した黒データのうち所定長連続する
黒データを、それぞれ水平および垂直方向の罫線として
認識する。セル抽出部210 は、認識した罫線にて囲まれ
る領域のうち、それらの最小単位の領域をそれぞれセル
として判定し、各セルの座標情報を算出する。この座標
情報は、たとえば、イメージデータの所定位置を基準と
する位置座標であり、各セルの四隅、4点の位置を示す
位置情報である。セル抽出部210 は、このようにして抽
出した各セルの座標情報をバス204 に出力して、表セル
情報メモリ214 に格納させる。
More specifically, the cell extracting unit 210 scans the image data in the form 400 in the horizontal (row) direction and the vertical (column) direction to obtain black data continuous in the horizontal direction and black data continuous in the horizontal direction. Is extracted. The cell extraction unit 210 recognizes black data that has continued for a predetermined length in the extracted black data as horizontal and vertical ruled lines, respectively. The cell extraction unit 210 determines each of the minimum unit areas among the areas surrounded by the recognized ruled lines as cells, and calculates coordinate information of each cell. The coordinate information is, for example, position coordinates based on a predetermined position of the image data, and is position information indicating four corners and four points of each cell. The cell extracting unit 210 outputs the coordinate information of each cell extracted in this way to the bus 204 and stores it in the table cell information memory 214.

【0031】表整列部212 は、各セルの位置座標を参照
して各セルを行(水平)方向および列(垂直)方向に整
列させ、この整列形態を表す整列情報を生成する機能部
である。表整列部212 は、生成した整列情報をバス204
に出力して、表セル情報メモリ214 に格納させる。表整
列部212 の詳細機能構成を説明すると、表整列部212
は、イメージデータにおける行を決定する行判定機能を
有する。
The table aligning unit 212 is a functional unit that aligns each cell in the row (horizontal) direction and the column (vertical) direction with reference to the position coordinates of each cell, and generates alignment information indicating this alignment form. . The table sorting unit 212 sends the generated sorting information to the bus 204.
And stored in the table cell information memory 214. The detailed functional configuration of the table sorting unit 212 will be described.
Has a line determination function of determining a line in image data.

【0032】詳しくは、表整列部212 は、各セルの高さ
を基準として項目行およびデータ行を決定し、表構造お
よびセル関連等を表す表セル構造データを作成する。こ
の表セル構造データは、各セルについてそれぞれ作成さ
れ、後述するように、属性情報、右セル情報、下セル情
報およびデータセル情報の各情報が記述される形式の整
列情報である。
More specifically, the table arranging unit 212 determines item rows and data rows based on the height of each cell, and creates table cell structure data indicating a table structure, cell relations, and the like. The table cell structure data is created for each cell, and is alignment information in a format in which each information of attribute information, right cell information, lower cell information, and data cell information is described as described later.

【0033】表整列部212 は、項目文字が記述されてい
る項目行における各セル高の最大値を基準として、項目
行の高さを判定し、項目行に対する分類処理を行う。た
とえば、表整列部212 は、各セルによる項目を行方向に
走査してゆき、各対象セルのそれぞの右側にあるセル
を、対象セルの右セルとして表セル構造データの右セル
情報に記述する。
The table sorting unit 212 determines the height of the item row based on the maximum value of each cell height in the item row in which the item character is described, and performs a classification process on the item row. For example, the table sorting unit 212 scans the items of each cell in the row direction, and describes the cell on the right side of each target cell in the right cell information of the table cell structure data as the right cell of the target cell. I do.

【0034】具体的には図5に示すように、項目行にお
いて、その左から「振込先」、「銀行名」、「預金種
目」、「口座番号」、「受取人名」および「金額」の各
項目順に、それぞれの項目ごとの属性情報として”項目
セル”を確認および決定し、さらに、右セル情報として
各項目の右側に存在する項目セル名を確認および決定し
て、各項目セルについて順次、表セル構造データを作成
する。最後に、項目行において項目セルが残っているか
どうかを確認する。この場合、水平方向に走査して残さ
れた項目「支店名」のセルについて表セル構造データを
作成する。図6に示すように、第1行目としてこれら項
目を含むようにして項目行が決定され、第2行目以降に
データ行が決定される。なお、この行方向のセル整列処
理において、各項目の次行に配置されているデータセル
を示すデータセル情報を特定する処理を行わず、データ
セル情報は次に説明する列方向のセル整列処理にて特定
する。表整列部212 は、このようにして作成した表セル
構造データを一旦、表セル情報メモリ214 に格納させ
る。
Specifically, as shown in FIG. 5, in the item line, from the left, “transfer destination”, “bank name”, “deposit item”, “account number”, “recipient name” and “amount” are displayed. In each item order, "item cell" is confirmed and determined as attribute information for each item, and the item cell name existing on the right side of each item is confirmed and determined as right cell information. , Create table cell structure data. Finally, check whether there are any remaining item cells in the item row. In this case, table cell structure data is created for cells of the item “branch name” left after scanning in the horizontal direction. As shown in FIG. 6, the item line is determined so as to include these items as the first line, and the data lines are determined from the second line onward. Note that, in this row-direction cell alignment processing, processing for specifying data cell information indicating the data cell arranged in the next row of each item is not performed, and the data cell information is processed in the column-direction cell alignment processing described below. Specify in. The table sorting unit 212 causes the table cell information memory 214 to temporarily store the table cell structure data created in this way.

【0035】このようにして作成した表セル構造データ
は、図7にその一例を示すように構成される。本実施例
では、同図(a) に示すように「振込先」の項目セルの構
造は、属性情報が”項目セル”、右セル情報が”銀行
名”、下セル情報が”なし”、そしてデータセル情報が
未設定としてたとえば空欄などにて作成される。また、
「銀行名」の項目セルの構造は、同図(b) に示すよう
に、属性情報が”項目セル”、右セル情報が”預金種
目”、下セル情報が”支店名”、そしてデータセル情報
は未設定となる。同様に、「預金種目」については、同
図(c) に示すように、右セル情報が”口座番号”、下セ
ル情報が”なし”、データセル情報が未設定となる。
The table cell structure data created in this way is configured as shown in FIG. In the present embodiment, as shown in FIG. 11A, the structure of the item cell of “transfer destination” is such that the attribute information is “item cell”, the right cell information is “bank name”, the lower cell information is “none”, Then, the data cell information is created as blank, for example, in a blank space. Also,
The structure of the item cell of "bank name" is as shown in FIG. 3 (b), the attribute information is "item cell", the right cell information is "deposit type", the lower cell information is "branch name", and the data cell Information is not set. Similarly, as for “deposit item”, as shown in FIG. 9C, the right cell information is “account number”, the lower cell information is “none”, and the data cell information is unset.

【0036】表整列部212 は、各データ行におけるデー
タセルについても同様にして表セル構造データを作成す
る。この場合、各セルの属性情報は”データセル”と
し、右セル情報は、右側にデータセルがある場合には、
そのセル名を記述する。なお、下セル情報については、
後述する列方向整列処理にて、同一データ行内で、対象
データセルの下に他のセルがある場合にはそのデータセ
ル名を設定し、ない場合には”なし”に設定する。
The table sorting section 212 creates table cell structure data for data cells in each data row in the same manner. In this case, the attribute information of each cell is “data cell”, and the right cell information is, if there is a data cell on the right side,
Describe the cell name. For lower cell information,
In the column direction alignment process described later, if there is another cell below the target data cell in the same data row, the data cell name is set, and if not, "none" is set.

【0037】また、表整列部212 は、列方向の整列を行
う機能を有する。表整列部212 は、行方向について作成
された表セル構造データを表セル情報メモリ214 より読
み出して、各表セル構造データにおけるデータセル情報
を決定する操作を行う。詳しくは、表整列部212 は、未
設定状態のデータセル情報を各セルについて設定する際
に、たとえば、図10(a) に示すように項目「振込先」の
データセル情報を”データ11”とし、同図(b) に示すよ
うに「銀行名」のデータセル情報を”なし”とし、同図
(c) に示すように預金種目のデータセル情報を”データ
12”とする。また、各データ行のセルにおけるデータセ
ル情報については、次行にデータセルがある場合にはそ
のセル名を記述する。たとえば、処理対象セルが”デー
11”のセルの場合には、”データ21”を記述する。表
整列部212 は、このようにして作成した表セル構造デー
タを表セル情報メモリ214 に供給して、メモリ内の表セ
ル構造データを更新する。
The table sorting section 212 has a function of sorting in the column direction. The table sorting unit 212 reads the table cell structure data created in the row direction from the table cell information memory 214, and performs an operation of determining data cell information in each table cell structure data. Specifically, when setting the unset data cell information for each cell, the table sorting unit 212 sets the data cell information of the item “transfer destination” to “data 11 ” as shown in FIG. 10A, for example. The data cell information of "bank name" is set to "none" as shown in FIG.
As shown in (c), the data cell information of the deposit type is
12 ". For the data cell information in the cells of each data row, if there is a data cell in the next row, describe the cell name. For example, if the cell to be processed is the cell of" data 11 " Describes “data 21. ” The table sorting unit 212 supplies the table cell structure data created in this way to the table cell information memory 214, and updates the table cell structure data in the memory.

【0038】さらに、表整列部212 は、一つの項目が複
数のセルによって構成されているいれ子状態のセル構造
を判定し、複数セルによる一項目セルを表す複合セルを
設定する機能を有している。詳しくは、表整列部212
は、複数のセルにより構成されている一項目が、データ
行のデータセルに対応する場合、それら複数の項目セル
を組み合わせた領域を複合セルとして仮想的に設定す
る。たとえば、項目行における「振込先」は、垂直方向
に走査しても、データ行の列幅とは対応しないので、こ
の「振込先」の列幅に「銀行名」の列幅を加えて、デー
タ行の列幅と比較する。この場合、項目セルについて合
計された列幅が、その下のデータ項目の列幅と一致する
ので、図8に示すように、これら「振込先」と「銀行
名」とに「支店名」を加えた3セルを表す複合セルを設
定する。この複合セルは、表セル構造データにおいて、
これら3つのセルの、上の行に存在するように仮想的に
定義づけられる。表整列部212 は、この複合セルに対し
ても表セル構造データを作成する。その際、表整列部21
2 は、図9に示すように、下セル情報を”振込先”とし
て仮想配置し、属性情報を”複合セル”、右セル情報
を”預金種目”、データセル情報を”なし”としてそれ
ぞれ設定する。表整列部212 は、このようにして作成し
た複合セルに関する情報を表セル情報メモリ214 に供給
して、表セル構造データに複合セルの各内容を追加記述
する。
Further, the table sorting unit 212 has a function of judging a cell structure in an nested state in which one item is composed of a plurality of cells, and setting a composite cell representing one item cell by the plurality of cells. ing. Specifically, the table aligning unit 212
When one item composed of a plurality of cells corresponds to a data cell of a data row, an area obtained by combining the plurality of item cells is virtually set as a composite cell. For example, the "transfer destination" in the item row does not correspond to the column width of the data row even when it is scanned in the vertical direction, so the column width of "bank name" is added to the column width of "transfer destination". Compare with the column width of the data row. In this case, since the total column width of the item cells matches the column width of the data item therebelow, as shown in FIG. 8, "branch name" is added to "transfer destination" and "bank name". A composite cell representing the added three cells is set. This composite cell is represented in the table cell structure data
These three cells are virtually defined as existing in the upper row. The table sorting unit 212 creates table cell structure data for the composite cell. At that time, the table sorting unit 21
2, as shown in FIG. 9, the lower cell information is virtually arranged as “transfer destination”, and the attribute information is set as “composite cell”, the right cell information is set as “deposit type”, and the data cell information is set as “none”. I do. The table sorting unit 212 supplies the information on the composite cell created in this way to the table cell information memory 214, and additionally describes each content of the composite cell in the table cell structure data.

【0039】表整列部212 は、このようにして、各セル
同士の関連性を表セル構造データにて表し、各セルを行
および列方向に関連づけて整列した表構造データを作成
する。とくに、たとえば、項目行において、入れ子状態
の項目セルに対して複合セルを作成し、同一項目行内の
下セル情報に関する記述が表セル構造データに作成され
ることから、項目行が複数行に分かれてしまうことが防
止される。また、入れ子状態の項目セルを認識して複合
セルを設定するから、入れ子状態の項目が複合セルによ
って代表され、他の項目セルおよび次行のデータセルと
の関係が明確に定義される。もちろん、データ行につい
ても同様の処理を行って、たとえば、1つのデータ行に
おいて、部分的に複数セルにて形成されている場合につ
いても、同一行内の下セル情報を設定することにより、
表構造を特定することが可能である。このように本実施
例では、一つの項目が複数のセルにて表されており、こ
れに一つのデータセルが対応する場合であっても、複数
のセルを一つのセルとして取り扱う複合セルを設定し
て、図9に示したような複合セルの表セル構造データを
作成することにより、表セルの構造を適切に定義するこ
とができる。
In this way, the table sorting unit 212 expresses the relevance of each cell by the table cell structure data, and creates table structure data in which the cells are aligned in the row and column directions. In particular, for example, in an item row, a composite cell is created for nested item cells, and a description of lower cell information in the same item row is created in the table cell structure data. Is prevented. Also, since the nested item cell is recognized and the composite cell is set, the nested item is represented by the composite cell, and the relationship between the other nested cell and the next row data cell is clearly defined. Of course, the same processing is performed for a data row, and for example, even when one data row is partially formed of a plurality of cells, by setting lower cell information in the same row,
It is possible to specify the table structure. As described above, in the present embodiment, one item is represented by a plurality of cells, and even when one data cell corresponds to this item, a composite cell that handles a plurality of cells as one cell is set. Then, by creating table cell structure data of a composite cell as shown in FIG. 9, the structure of the table cell can be appropriately defined.

【0040】表セル情報メモリ214 は、セル抽出部210
にて作成された座標情報と、表整列部212 にて作成され
た整列情報の表セル構造データとを格納する記憶領域を
有する。表セル情報メモリ214 に、これら座標情報と整
列情報とが格納されると認識部216 は、データ行に対す
る文字認識処理を開始する。
The table cell information memory 214 includes a cell extraction unit 210
And the storage area for storing the table cell structure data of the alignment information created by the table aligning unit 212. When the coordinate information and the alignment information are stored in the table cell information memory 214, the recognizing unit 216 starts a character recognition process for the data line.

【0041】認識部216 は、表セル情報メモリ214 に格
納された座標情報および整列情報に基づいて、画像メモ
リ208 に格納されているイメージデータの各領域に記入
もしくは印字されている文字列を認識する機能部であ
る。認識部216 は、認識した文字列を対応する文字コー
ドに変換し、その変換結果を認識結果格納メモリ218 に
格納させる。
The recognition unit 216 recognizes a character string written or printed in each area of the image data stored in the image memory 208 based on the coordinate information and the alignment information stored in the table cell information memory 214. It is a functional unit that performs The recognition unit 216 converts the recognized character string into a corresponding character code, and stores the conversion result in the recognition result storage memory 218.

【0042】詳しくは、認識部216 は、各セルの座標情
報および整列情報に応じて処理対象のセルを決定し、画
像メモリ208 に格納されているイメージデータのうち、
対象セルに対応する位置に配置された文字画像を表すイ
メージデータを画像メモリ208 から読み出し、文字画像
に対応する文字コードを生成する。認識部216 は、文字
画像を認識するための基準となる文字パターンおよびそ
の特徴を示す情報を認識辞書として記憶保持しており、
各セルに対応する文字画像を切り出して抽出されたイメ
ージデータを、認識辞書内の文字パターンおよび特徴情
報と比較照合する。認識部216 は、比較照合の結果、相
関の高い文字パターン順に候補文字の優先順位を決定
し、名詞、文脈等を記憶した解析辞書を用いて、適切な
文字を選択する。認識部216 は、このように選択した文
字列を候補文字列として各セル対応に順次記憶保持し、
これを帳票400 に関する表構造データにてリンクされる
全セルについて行う。認識部216 は、このようにして認
識した文字に対し、所定形式の文字コードを付与して、
制御部220 からの要求に応動してバス204 に出力すると
ともに表構造データからその表形式を表す所定形式の罫
線コードを作成してバス204 に出力する。また認識部21
6 は、表形式および文字の位置およびサイズ等を示す書
式情報をバス204 に出力する。これら所定形式の文字コ
ード、罫線コードおよび制御文字による書式情報は、文
書形式のデータに限らず、たとえば、表計算ソフトウエ
ァにて使用される表形式のバイナリデータでもよい。
More specifically, the recognizing unit 216 determines a cell to be processed in accordance with the coordinate information and the alignment information of each cell, and among the image data stored in the image memory 208,
Image data representing a character image arranged at a position corresponding to the target cell is read from the image memory 208, and a character code corresponding to the character image is generated. The recognition unit 216 stores and holds a character pattern serving as a reference for recognizing a character image and information indicating its characteristics as a recognition dictionary.
Image data extracted by extracting a character image corresponding to each cell is compared with character patterns and feature information in a recognition dictionary. As a result of the comparison and collation, the recognition unit 216 determines the priority order of the candidate characters in the order of the character pattern having the highest correlation, and selects an appropriate character using an analysis dictionary storing nouns, contexts, and the like. The recognition unit 216 sequentially stores and holds the selected character string as a candidate character string for each cell,
This is performed for all cells linked by the table structure data relating to the form 400. The recognition unit 216 assigns a character code in a predetermined format to the character thus recognized,
In response to a request from the control unit 220, the data is output to the bus 204, and a ruled line code of a predetermined format representing the table format is created from the table structure data and output to the bus 204. Recognition unit 21
6 outputs to the bus 204 format information indicating the table format and the position and size of characters. The format information based on the character code, the ruled line code, and the control character in the predetermined format is not limited to data in a document format, but may be, for example, binary data in a table format used by spreadsheet software.

【0043】なお、制御部220 より、候補文字変更の要
求があった場合には、認識部216 は、要求に応じた文字
を候補文字と置き換えて認識結果を修正する。また、認
識部216 は、項目行に記述されている項目名に対する文
字認識処理を、表構造を特定する際にあらかじめ行う機
能を有する。しかしこれに限らず、データ行の各セルに
記録された各文字を認識する前または後に、項目名を認
識するようにしてもよい。また、本実施例では、表構造
のセル内データについて文字認識を行う点について説明
しているが、認識部216 は、罫線等が記述されていな
い、たとえば表枠の外側や通常文章等の各行内の文字に
ついても文字認識を行う機能を有する。
When a request for changing candidate characters is received from the control unit 220, the recognition unit 216 corrects the recognition result by replacing the characters corresponding to the request with candidate characters. The recognizing unit 216 has a function of performing a character recognition process on the item name described in the item row in advance when specifying the table structure. However, the present invention is not limited to this, and the item name may be recognized before or after recognizing each character recorded in each cell of the data row. Further, in this embodiment, a description is given of the point that character recognition is performed on data in a cell having a table structure. However, the recognizing unit 216 does not include a ruled line or the like. It also has a function to perform character recognition for characters in the box.

【0044】認識結果格納メモリ218 は、認識部216 に
おける処理結果の文字コード、罫線コードおよび書式情
報等の認識結果を格納する記憶領域を有する。なお、図
2において、画像メモリ208 、表セル情報メモリ214 お
よび認識結果格納メモリ218の各記憶回路は、それぞれ
別ブロックのメモリ構成として示しているが、これに限
らず、たとえば、コンピュータ装置の主記憶を構成する
同一種類のランダムアクセスメモリの各記憶領域に各機
能ごとに格納されて区分されてよい。
The recognition result storage memory 218 has a storage area for storing a recognition result such as a character code, a ruled line code, and format information of the processing result in the recognition section 216. In FIG. 2, the memory circuits of the image memory 208, the table cell information memory 214, and the recognition result storage memory 218 are shown as memory structures of separate blocks. However, the present invention is not limited to this. Each function may be stored and divided in each storage area of the same type of random access memory constituting the storage.

【0045】制御部220 は、各機能部を制御する制御機
能と、各部からの情報をバス204 を介して所望の機能部
に転送する転送機能と、各種演算処理機能とを有する機
能部である。たとえば制御部220 は、帳票400 、1頁分
の認識結果が認識結果格納メモリ218 に蓄積されると、
それら文字および罫線コードと書式情報とをバス204に
読み出して出力部202 に転送する。出力部202 は、画像
メモリ208 に格納されているイメージデータを処理して
モニタ装置312 に供給することにより、読み取り画像を
表示させるとともに、認識結果格納メモリ218 から読み
出された情報を、出力先に応じた形式のデータに変換し
て、表示用の画像信号やプリント用の画像データを作成
する。これにより、モニタ装置312 の表示画面にはその
認識処理後の表および文字が表示され、また、プリンタ
装置314 は、それら情報を所定用紙にプリントして出力
する。
The control section 220 is a function section having a control function for controlling each function section, a transfer function for transferring information from each section to a desired function section via the bus 204, and various arithmetic processing functions. . For example, when the recognition result for the form 400 and one page is accumulated in the recognition result storage memory 218, the control unit 220
These characters, ruled line codes, and format information are read out to the bus 204 and transferred to the output unit 202. The output unit 202 processes the image data stored in the image memory 208 and supplies the processed image data to the monitor device 312 so that the read image is displayed and the information read from the recognition result storage memory 218 is output to the output destination. The image data for display and the image data for printing are created by converting the data into a data in a format according to. As a result, the table and the characters after the recognition processing are displayed on the display screen of the monitor device 312, and the printer device 314 prints and outputs the information on a predetermined sheet.

【0046】以上のような構成で、本実施例におけるシ
ステム10の処理動作を説明すると、図1に示すステップ
100 において、帳票400 が画像入力装置302 の読取部に
セットされると、その原稿上の記録画像が走査されて、
濃淡に応じた電気信号が生成され、そのイメージデータ
がコンピュータ装置306 の画像入力部206 に入力され
る。また、イメージデータがファックス送信されると、
ファクシミリ装置316 はこれを受信し、復号等の処理を
経たイメージデータが画像入力部206 に入力される。画
像入力部206 に入力したイメージデータは、それがカラ
ー画像等の階調データである場合には、モノクロの2値
画像データに変換され、変換されたイメージデータは、
画像メモリ208 に格納される。
The processing operation of the system 10 in the present embodiment with the above configuration will be described.
At 100, when the form 400 is set on the reading unit of the image input device 302, the recorded image on the original is scanned,
An electric signal corresponding to the shading is generated, and the image data is input to the image input unit 206 of the computer device 306. Also, when the image data is faxed,
The facsimile apparatus 316 receives this, and the image data that has undergone processing such as decoding is input to the image input unit 206. The image data input to the image input unit 206 is converted into monochrome binary image data if the image data is gradation data such as a color image, and the converted image data is
It is stored in the image memory 208.

【0047】このようにして認識対象のイメージデータ
が格納されるとステップ102 に進んでセル抽出処理が行
われる。セル抽出部210 では、画像メモリ208 に格納さ
れたイメージデータにおける水平および垂直方向の連続
黒データが抽出されて、帳票400 における罫線が認識さ
れる。次いで、認識された罫線にて囲まれた領域がセル
として判定され、各セルの位置を表す座標情報が作成さ
れる。作成された座標情報は、このイメージデータに対
するセル位置を示す情報として表セル情報メモリ214 に
格納される。
When the image data to be recognized is stored in this way, the process proceeds to step 102, where a cell extraction process is performed. In the cell extracting section 210, continuous black data in the horizontal and vertical directions in the image data stored in the image memory 208 is extracted, and the ruled lines in the form 400 are recognized. Next, the area surrounded by the recognized ruled line is determined as a cell, and coordinate information representing the position of each cell is created. The created coordinate information is stored in the table cell information memory 214 as information indicating the cell position with respect to this image data.

【0048】このようにして帳票400 におけるセルが抽
出されると、ステップ104 に進み、表整列処理が行われ
る。行方向整列処理106 では、帳票400 における上端に
行方向に配列されている各セルについて、その高さがそ
れぞれ判定され、行方向に複数のセルがある場合でも、
各セルの最大高さが第1行目の項目行として認識され
る。項目行が決定されると、認識部216 では、項目行に
おける項目文字に対する文字認識が行われて、各項目の
内容がコードデータ化される。次いで、項目行における
左側のセルからその項目名が認識されてゆき、「振込
先」から「金額」までのそれぞれの属性情報として”項
目セル”が設定され、さらに、この項目行における「支
店名」についても”項目セル”としてその属性情報が設
定される。項目行における属性情報が確定すると、各項
目セルごとに属性情報が記述された表セル構造データが
表セル情報メモリ214 に格納される。データ行における
各セルについても同様にして属性情報を”データセル”
とする表セル構造データがそれぞれ作成されて、表セル
情報メモリ214 に格納される。
When the cells in the form 400 are extracted in this way, the process proceeds to step 104, where the table arrangement processing is performed. In the row direction alignment processing 106, the height of each cell arranged in the row direction at the upper end of the form 400 is determined, and even when there are a plurality of cells in the row direction,
The maximum height of each cell is recognized as the first item line. When the item line is determined, the recognizing unit 216 performs character recognition on the item character in the item line, and converts the content of each item into code data. Next, the item name is recognized from the left cell in the item row, "item cell" is set as each attribute information from "transfer destination" to "amount", and "branch name" in this item row is further set. , The attribute information is set as “item cell”. When the attribute information in the item row is determined, the table cell structure data in which the attribute information is described for each item cell is stored in the table cell information memory 214. The attribute information is similarly set to “data cell” for each cell in the data row.
Are generated and stored in the table cell information memory 214.

【0049】このようにして行方向に対する整列処理が
完了すると、列方向整列処理108 が行われる。この処理
108 では、それぞれの項目セルおよびデータセルについ
て、データセル情報が認識される。このとき入れ子状態
のセル構造が判定されると、複合セルが作成され、たと
えば、図9に示すような複合セルに関する情報が作成さ
れる。作成された情報は表セル情報メモリ214 に供給さ
れて、格納されている表セル構造データに追加記述され
る。
When the alignment processing in the row direction is completed as described above, a column direction alignment processing 108 is performed. This process
At 108, data cell information is recognized for each item cell and data cell. At this time, if the nested cell structure is determined, a composite cell is created, and for example, information on the composite cell as shown in FIG. 9 is created. The created information is supplied to the table cell information memory 214 and is additionally described in the stored table cell structure data.

【0050】このようにして、表セル構造データが互い
のセルに関連づけられて整列されると、ステップ110 に
進み、データ行における文字認識処理が開始される。認
識部216 では、表セル情報メモリ214 に格納されている
座標情報および整列情報に基づいて、処理対象のセルが
決定され、対象セルに対応するイメージデータが画像メ
モリ208 から読み出される。本実施例では、各データ行
におけるデータセルのイメージデータの文字画像と認識
辞書とが照合されて、文字画像に対応するコードデータ
が生成される。さらに、表セル構造データから罫線およ
び書式情報が認識部216 にて作成されて、これら文字コ
ード、罫線コードおよび書式情報がバス204 を介して認
識結果格納メモリ218 に格納される。
When the table cell structure data is aligned in relation to each other in this manner, the process proceeds to step 110, where the character recognition processing in the data line is started. In the recognizing unit 216, the cell to be processed is determined based on the coordinate information and the alignment information stored in the table cell information memory 214, and the image data corresponding to the target cell is read from the image memory 208. In the present embodiment, the character image of the image data of the data cell in each data row is collated with the recognition dictionary, and code data corresponding to the character image is generated. Further, ruled lines and format information are created by the recognition unit 216 from the table cell structure data, and these character codes, ruled line codes, and format information are stored in the recognition result storage memory 218 via the bus 204.

【0051】次いでステップ112 に進み、認識結果格納
メモリ218 に格納された情報は、制御部220 の制御に応
動して出力部202 に転送され、表示用の画像信号に変換
され、モニタ装置312 に供給される。操作者は、モニタ
装置312 に表示された表および文字などの認識結果を確
認して、修正等が必要であれば、入力装置を操作して候
補文字を修正する処理を行うことができる。このように
して認識結果が確定されると、認識結果を表す画像を必
要に応じてプリントしたり、情報記録媒体にファイルと
して記録保管したりする。
Next, proceeding to step 112, the information stored in the recognition result storage memory 218 is transferred to the output unit 202 in response to the control of the control unit 220, converted into an image signal for display, and transmitted to the monitor device 312. Supplied. The operator can confirm the recognition result of the table, the character, and the like displayed on the monitor device 312, and can perform a process of correcting the candidate character by operating the input device if correction or the like is necessary. When the recognition result is determined in this way, an image representing the recognition result is printed as needed, or recorded and stored as a file on an information recording medium.

【0052】なお、同一表形式の複数枚帳票400 を連続
処理する場合には、第1枚目で認識した解析結果の座標
情報と、整列情報の表セル構造データとを用いて、2枚
目以降の認識処理を行うことにより処理の高速化を図る
ことができる。また、解析結果を保存しておくことによ
り、複数種類の帳票が混在していたとしても、帳票の種
類に応じた解析結果の表セル構造データ等を選択して使
用することにより、表構造の認識処理、つまり表セル構
造データの作成処理を、毎回行わずにすむ。これは、た
とえば、帳票の種類を表す帳票番号と表セル構造データ
とを対応させて行う。
When continuously processing a plurality of sheets 400 in the same table format, the second sheet 400 is used by using the coordinate information of the analysis result recognized on the first sheet and the table cell structure data of the alignment information. By performing the subsequent recognition processing, the processing can be speeded up. Also, by storing the analysis results, even if a plurality of types of forms are mixed, by selecting and using the table cell structure data of the analysis results according to the types of the forms, the table structure can be improved. The recognition process, that is, the process of creating table cell structure data does not have to be performed every time. This is performed by, for example, associating a form number representing a form type with table cell structure data.

【0053】次に、図11を参照して、システム10の他の
実施例を説明する。同図に示すようにこの実施例では、
項目「金額」に対応するデータセルが複数桁の領域にて
区分されている帳票1100に対する認識処理を適切に行う
点で図1〜3に示した第1の実施例とは異なり、そのほ
かについては第1の実施例と同様の機能構成でよいので
その説明を省略する。
Next, another embodiment of the system 10 will be described with reference to FIG. As shown in FIG.
The first embodiment shown in FIGS. 1 to 3 is different from the first embodiment in that a recognition process is appropriately performed on a form 1100 in which a data cell corresponding to an item “amount” is divided by a plurality of digits. Since the same functional configuration as in the first embodiment may be used, the description is omitted.

【0054】図示するように帳票1100は、項目行に「銀
行名」〜「金額」の各項目が配置されており、とくに項
目「金額」に対応する各データ行には、数字や記号等の
文字が各桁ごとに記入されるように、各桁を区分けする
点線および破線等の罫線が記録されている。
As shown in the figure, the form 1100 has items of “bank name” to “amount” arranged in the item line, and in particular, each data line corresponding to the item “amount” includes numerals and symbols. A dotted line and a ruled line, such as a broken line, for dividing each digit are recorded so that characters are entered for each digit.

【0055】本実施例におけるセル抽出部210 は、画像
メモリ208 に格納されているイメージデータから、これ
ら区分されている領域についてそれぞれセルとして抽出
し、各セルの座標情報を表セル情報メモリ214 に格納さ
せる。また、表整列部212 は、上述の実施例と同様にし
て行方向の整列処理を行った後、列方向の整列処理を行
う。本実施例における列方向の整列処理は、データセル
の幅に応じて項目セルを対応させてデータセル情報を決
定する。
The cell extracting section 210 in this embodiment extracts each of these divided areas as cells from the image data stored in the image memory 208, and stores the coordinate information of each cell in the table cell information memory 214. Store. In addition, the table sorting unit 212 performs row-wise sorting in the same manner as in the above-described embodiment, and then performs column-wise sorting. In the alignment processing in the column direction according to the present embodiment, data cell information is determined by associating item cells according to the width of data cells.

【0056】詳しくは、表整列部212 は、列方向の整列
処理において、図12に示すように、項目セルの幅と、そ
の下に配置されているデータセルの幅とを比較して、項
目セル幅よりも小さい幅のデータセルを認識する。表整
列部212 は、認識したデータセルについて項目セル幅と
同じ幅になるまで、データセルの幅を合計し、複数のデ
ータセルを合計した結果が項目セル幅と一致する場合
に、それらデータセルを結合して一つの結合セル1200と
して認識するとともに、結合セル1200を項目セルに対応
させる。この場合、表整列部212 は、この結合セル1200
を特定する表セル構造データを作成し、表セル情報メモ
リ214 に格納させる。
More specifically, the table sorting unit 212 compares the width of an item cell with the width of a data cell disposed thereunder as shown in FIG. Recognize data cells having a width smaller than the cell width. The table sorting unit 212 sums the widths of the data cells until the recognized data cells have the same width as the item cell width. If the result of adding the plurality of data cells matches the item cell width, the data cell Are combined and recognized as one combined cell 1200, and the combined cell 1200 is made to correspond to the item cell. In this case, the table aligning unit 212
Is created, and stored in the table cell information memory 214.

【0057】図11に示した例では、「金額」に対応する
データセルが、たとえばデータ行の第1行目において
「データ (1,6)」〜「データ(1,11)」の各セルによって
示されており、表整列部212 は、これらデータセル (1,
6)〜(1,11)を表す結合セルを作成し、その表セル構造デ
ータを作成する。この場合の結合セル1200は、属性情報
が”結合セル”で、右セルおよび下セル情報がそれぞ
れ”なし”で、データセル情報は、次行のデータセル
の”結合セル (2,6 〜2,11) ”となる。また「金額」の
表セル構造は、属性情報が”項目セル”で、右セルおよ
び下セル情報がそれぞれ”なし”で、データセル情報
は、次行のデータセルの”結合セル(1,6〜 1,11)”とな
る。
In the example shown in FIG. 11, the data cell corresponding to "amount" is, for example, each cell of "data (1,6)" to "data (1,11)" in the first row of the data row. , The table sorting unit 212 uses these data cells (1,
6) Create merged cells representing (1,11) and create table cell structure data thereof. In this case, the merged cell 1200 has the attribute information “merged cell”, the right cell information and the lower cell information “none”, and the data cell information is “combined cell (2,6 to 2) , 11) ". In the table cell structure of “amount”, the attribute information is “item cell”, the right cell and the lower cell information are “none”, and the data cell information is “combined cell (1, 6 ~ 1,11) ".

【0058】また、認識部216 は、結合セル1200に対応
するデータセルのイメージデータを画像メモリ208 より
読み出して、各セルに対応するイメージデータにおける
文字認識処理を行う。とくに認識部216 は、「金額」の
項目セルに対応するデータ行における結合セル1200に記
入された文字画像に対する認識処理を行う。その認識結
果は、結合セルに対する認識結果として、認識結果格納
メモリ218 に格納される。この場合、認識部216 は、結
合セルに対応するイメージデータに対して、縦罫線の除
去処理を行ってから文字認識処理を行うとよい。
The recognizing unit 216 reads out the image data of the data cell corresponding to the merged cell 1200 from the image memory 208 and performs a character recognition process on the image data corresponding to each cell. In particular, the recognition unit 216 performs a recognition process on the character image written in the merged cell 1200 in the data row corresponding to the item cell of “money”. The recognition result is stored in the recognition result storage memory 218 as a recognition result for the combined cell. In this case, the recognizing unit 216 may perform the character recognition process after performing the vertical ruled line removal process on the image data corresponding to the combined cell.

【0059】以上説明したように本実施例では、「金
額」の項目セル対応する複数のデータセルを、複数に分
割して独立した領域としては文字認識処理を行わず、結
合セルを単位として文字認識処理を行うので、意味上密
接に関連する複数桁の「金額」欄の項目セルに対応する
データ行の認識結果として、金額に対応する一連の数字
および記号等を表す認識結果を出力することができる。
As described above, in the present embodiment, a plurality of data cells corresponding to the item cell of "money" are divided into a plurality of independent areas and the character recognition processing is not performed. Since the recognition process is performed, a recognition result representing a series of numbers and symbols corresponding to the money amount is output as the recognition result of the data row corresponding to the item cell of the “money” column of a plurality of digits that are closely related in meaning. Can be.

【0060】次に、図13を参照して、システム10の他の
実施例を説明する。同図に示すようにこの実施例では、
項目行における項目セル「振込先」について、その下の
行方向に並んで「銀行名」および「支店名」が入れ子状
態となって配列している帳票1300に対する認識処理を適
切に行う点で上述の実施例とは異なり、そのほかについ
ては上記実施例と同様の機能構成でよいのでその説明を
省略する。
Next, another embodiment of the system 10 will be described with reference to FIG. As shown in FIG.
Regarding the item cell "transfer destination" in the item row, the recognition process is appropriately performed for the form 1300 in which the "bank name" and "branch name" are nested and arranged in the row direction below Unlike the third embodiment, the other components may have the same functional configuration as the above-described embodiment, and thus the description thereof will be omitted.

【0061】図示するように帳票1300は、項目行内にお
いて「振込先」〜「金額」の各項目が配置され、「振込
先」の下段にはさらに「銀行名」および「支店名」の各
項目が入れ子状態となって配置されている帳票である。
As shown in the figure, in the form 1300, each item of “transfer destination” to “amount” is arranged in an item row, and further, each item of “bank name” and “branch name” is arranged below the “transfer destination”. Is a form arranged in a nested state.

【0062】本実施例における表整列部212 は、上述の
実施例と同様にして、行方向の整列処理を行って行分類
した後、列方向の整列処理を行う。具体的には、図15
(a) 〜(c) にその一例を示すように、「振込先」の項目
セルに対する表セル構造データは、属性情報が”項目セ
ル”、右セル情報が”預金種目”、下セル情報が”銀行
名”となる。また、「銀行名」の項目セルに対する表セ
ル構造データは、属性情報が”項目セル”、右セル情報
が”支店名”、下セル情報が”なし”となる。また、
「支店名」の項目セルに対する表セル構造データは、属
性情報が”項目セル”、右セル情報が”なし”、下セル
情報が”なし”となる。なお、この行方向の整列処理に
おけるデータセル情報の内容は、上述の実施例と同様に
未設定となっている。また、各データセルについても上
記実施例と同様に整列処理が行われる。
The table sorting unit 212 in the present embodiment performs row-wise sorting and classifies rows in the same manner as in the above-described embodiment, and then performs column-wise sorting. Specifically, FIG.
As shown in (a) to (c), as an example, the table cell structure data for the item cell of “transfer destination” has attribute information “item cell”, right cell information “deposit type”, and lower cell information "Bank name". In the table cell structure data for the item cell of "bank name", the attribute information is "item cell", the right cell information is "branch name", and the lower cell information is "none". Also,
In the table cell structure data for the item cell of “branch name”, the attribute information is “item cell”, the right cell information is “none”, and the lower cell information is “none”. Note that the contents of the data cell information in the row direction alignment processing are unset as in the above-described embodiment. The alignment process is also performed on each data cell in the same manner as in the above embodiment.

【0063】次に、列方向の整列処理は、データセル情
報を決定する処理を行う際に、入れ子状態の項目セルを
認識して、入れ子部分の項目セルとデータセルとを対応
づける処理を行う。
Next, in the alignment process in the column direction, when the process of determining data cell information is performed, a process of recognizing nested item cells and associating nested item cells with data cells is performed. .

【0064】詳しくは、表整列部212 は、図14に示すよ
うに、項目行内に複数段の項目セルが存在する場合に、
上段の項目セルの幅と、その下に配置された下段の項目
セルの幅とを比較して、項目セル幅よりも小さい幅の項
目セルを認識する。表整列部212 は、認識した項目セル
について上段の項目セル幅と同じ幅になるまで、下段の
項目セルの幅を合計し、複数の項目セルを合計した結
果、上段の項目セルと同幅となって、さらに下段の項目
セル幅がそれぞれデータセルの幅に一致する場合に、下
段の項目セルとデータセルとを対応づける。
More specifically, as shown in FIG. 14, when a plurality of rows of item cells exist in an item row, as shown in FIG.
By comparing the width of the upper item cell with the width of the lower item cell disposed therebelow, an item cell having a width smaller than the item cell width is recognized. The table sorting unit 212 sums the widths of the lower item cells until the recognized item cells have the same width as the upper item cell width, and as a result of summing a plurality of item cells, as a result, has the same width as the upper item cell. If the item cell widths in the lower row match the widths of the data cells, the lower item cell is associated with the data cell.

【0065】この対応付け処理は、表セル構造データ中
のデータセル情報を定義する処理であり、たとえば図15
(a) 〜(c) に示したように、項目「振込先」、「銀行
名」および「支店名」における未設定状態のデータセル
情報を、それぞれ”なし”、”データ11”および”デー
12”と設定する。表整列部212 は、このように行およ
び列方向の整列処理を行って各セルの構造およびそれら
の関係を特定する整列情報として表セル構造データを作
成し、表セル情報メモリ214 に格納させる。
This associating process is a process for defining data cell information in the table cell structure data.
As shown in (a) to (c), the data cell information in the unset state in the items “transfer destination”, “bank name” and “branch name” are respectively “none”, “data 11 ” and “data”. Set to 12 ". The table arranging unit 212 performs the row and column arranging process in this manner to create table cell structure data as alignment information for specifying the structure of each cell and their relationship, and causes the table cell information memory 214 to store the table cell structure data.

【0066】認識部216 は、表セル情報メモリ214 に格
納されている座標情報および整列情報に基づいて、各項
目セルおよびデータセルに対応するイメージデータにお
ける文字を認識して、その認識結果を認識結果格納メモ
リ218 に格納させる。このように本実施例では、項目の
セルと、データのセルとが入れ子の状態になって、入れ
子の項目セルがデータセルに対応している場合でも、入
れ子状態のそれぞれの項目セルと、データセルとを対応
させる整列処理を行うことにより、帳票1300のような項
目行の形式であっても、「振込先」が「銀行名」や「支
店名」に対応づけられるのみならず、「銀行名」および
「支店名」にそれぞれ対応するデータ行のデータセルが
特定され、対応するデータセルごとに文字認識処理が行
われる。
The recognizing unit 216 recognizes characters in the image data corresponding to each item cell and data cell based on the coordinate information and alignment information stored in the table cell information memory 214, and recognizes the recognition result. The result is stored in the result storage memory 218. As described above, in the present embodiment, even when the item cells and the data cells are nested and the nested item cells correspond to the data cells, each of the nested item cells and the data By performing the sorting process that associates the cells, even in the form of an item row such as the form 1300, not only is the "transfer destination" associated with the "bank name" or "branch name", but also the "bank" The data cells of the data rows respectively corresponding to the "name" and "branch name" are specified, and a character recognition process is performed for each corresponding data cell.

【0067】以上説明したように、上記各実施例では、
項目のセルが複数で、データのセルが一つのセルで表さ
れている表形式や、項目のセルが一つで、データのセル
が複数で横(行)方向に並んでいる表形式、さらには、
項目のセルとデータのセルとが入れ子の状態となってい
る表形式に対して、適切に読み取ることができ、表構造
に応じた認識結果を的確に生成し出力することができ
る。
As described above, in each of the above embodiments,
A table format with multiple item cells and a single data cell, a table format with one item cell and multiple data cells arranged in the horizontal (row) direction, Is
It is possible to appropriately read a table format in which the cell of the item and the cell of the data are nested, and to accurately generate and output the recognition result according to the table structure.

【0068】[0068]

【発明の効果】このように本発明によれば、表組みされ
た各領域のセル構造を高精度に認識する表セル構造デー
タを作成して、複数セルで一つの項目を表されたり、複
数セルで一組のデータを表されたりした帳票形式のセル
構造を適切に認識することができるので、セル構造に応
じた文字認識処理を的確に行うことができる。
As described above, according to the present invention, table cell structure data for recognizing the cell structure of each region in a table with high accuracy is prepared, and one item can be represented by a plurality of cells. Since a cell structure in a form in which a set of data is represented by a cell can be appropriately recognized, character recognition processing according to the cell structure can be accurately performed.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明が適用された実施例の文字認識システム
における動作を示すフローチャートである。
FIG. 1 is a flowchart showing an operation in a character recognition system according to an embodiment to which the present invention is applied.

【図2】文字認識システムのコンピュータ装置の機能構
成例を示すブロック図である。
FIG. 2 is a block diagram illustrating a functional configuration example of a computer device of the character recognition system.

【図3】本発明が適用された文字認識システムのシステ
ム構成例を示す図である。
FIG. 3 is a diagram showing a system configuration example of a character recognition system to which the present invention is applied.

【図4】実施例にて文字認識処理を行う帳票の一例を示
す図である。
FIG. 4 is a diagram illustrating an example of a form on which character recognition processing is performed in the embodiment.

【図5】項目行における項目セルの特定状態を示す図で
ある。
FIG. 5 is a diagram showing a specific state of an item cell in an item row.

【図6】項目行およびデータ行の決定状態を示す図であ
る。
FIG. 6 is a diagram showing a determination state of an item row and a data row.

【図7】行方向整列処理にて作成される表セル構造デー
タの一例を示す図である。
FIG. 7 is a diagram showing an example of table cell structure data created in a row direction alignment process.

【図8】複合セルの作成状態を示す図である。FIG. 8 is a diagram showing a creation state of a composite cell.

【図9】複合セルの表セル構造データの一例を示す図で
ある。
FIG. 9 is a diagram showing an example of table cell structure data of a composite cell.

【図10】列方向整列処理にて作成される表セル構造デ
ータの一例を示す図である。
FIG. 10 is a diagram showing an example of table cell structure data created by a column direction alignment process.

【図11】実施例にて文字認識処理を行う帳票の一例を
示す図である。
FIG. 11 is a diagram illustrating an example of a form on which character recognition processing is performed in the embodiment.

【図12】項目「金額」に対応するデータセルから結合
セルを作成する一例を示す図である。
FIG. 12 is a diagram showing an example of creating a merged cell from a data cell corresponding to an item “money”.

【図13】実施例にて文字認識処理を行う帳票の一例を
示す図である。
FIG. 13 is a diagram illustrating an example of a form on which character recognition processing is performed in the embodiment.

【図14】入れ子状態の項目セルとデータセルとの対応
関係を示す図である。
FIG. 14 is a diagram showing the correspondence between nested item cells and data cells.

【図15】整列処理にて作成される表セル構造データの
一例を示す図である。
FIG. 15 is a diagram showing an example of table cell structure data created in the alignment processing.

【符号の説明】[Explanation of symbols]

102 セル抽出処理 104 表整列処理 106 行方向整列処理 108 列方向整列処理 110 認識処理 206 画像入力部 208 画像メモリ 210 セル抽出部 212 表整列部 214 表セル情報メモリ 216 認識部 218 認識結果格納メモリ 102 Cell extraction processing 104 Table alignment processing 106 Row alignment processing 108 Column alignment processing 110 Recognition processing 206 Image input unit 208 Image memory 210 Cell extraction unit 212 Table alignment unit 214 Table cell information memory 216 Recognition unit 218 Recognition result storage memory

【手続補正書】[Procedure amendment]

【提出日】平成12年3月7日(2000.3.7)[Submission date] March 7, 2000 (200.3.7)

【手続補正1】[Procedure amendment 1]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】0003[Correction target item name] 0003

【補正方法】変更[Correction method] Change

【補正内容】[Correction contents]

【0003】たとえば、一般帳票として、罫線等にて囲
まれた表形式の一般帳票に対して、文字認識処理を行う
際には、罫線にて囲まれる項目の領域をセルとして取り
扱い、各セル内における文字を認識するものであった。
たとえば、特許第2740335 号の特許公報には、自動セル
属性判定機能を有する表読取装置が開示されている。こ
の公報に記載の発明では、罫線で囲まれたセル内の文字
を読み取る際、数字・記号や書式等のセル内文字内容に
関するセル属性を自動的に判定し、セル属性に応じた文
字認識処理を行うことにより文字認識率を向上させると
いうものであった。
For example, when performing character recognition processing on a general form in a tabular form surrounded by a ruled line or the like as a general form, the area of the item surrounded by the ruled line is treated as a cell, and Was recognized.
For example, Japanese Patent Publication No. No. 2740335, table reading equipment is disclosed having an automatic cell attribute determination function. According to the invention described in this publication, when reading a character in a cell surrounded by a ruled line, a cell attribute relating to the character content in the cell such as a number, a symbol, and a format is automatically determined, and a character recognition process corresponding to the cell attribute is performed. Is performed to improve the character recognition rate.

Claims (18)

【特許請求の範囲】[Claims] 【請求項1】 情報記録媒体に記録された画像を読み取
って得られるイメージ情報に応じて、該イメージ情報に
対応する文字情報を認識する文字認識方法において、該
方法は、 前記イメージ情報を入力する入力工程と、 前記イメージ情報から罫線にて囲まれる表領域における
最小単位のセルを抽出し、該セルの位置を表す座標情報
を各セルごとに生成するセル抽出工程と、 前記表領域の構造を各セルを整列させて特定し、該構造
を表す整列情報を生成する表整列工程と、 前記座標情報および整列情報に基づいて、前記セルに対
応する前記イメージデータから前記文字情報を認識する
認識工程と、 該認識工程にて認識される文字情報を出力する認識結果
出力工程とを含み、 前記表整列工程は、行方向の整列処理と列方向の整列処
理とを行って、各セル間の関係を表す整列情報を各セル
についてそれぞれ生成することを特徴とする文字認識方
法。
1. A character recognition method for recognizing character information corresponding to image information according to image information obtained by reading an image recorded on an information recording medium, the method comprising: inputting the image information An input step, a cell extraction step of extracting a minimum unit cell in a table region surrounded by ruled lines from the image information, and generating coordinate information for each cell for each cell, and a structure of the table region. A table alignment step of aligning and specifying each cell and generating alignment information representing the structure; and a recognition step of recognizing the character information from the image data corresponding to the cell based on the coordinate information and the alignment information. And a recognition result output step of outputting character information recognized in the recognition step, wherein the table sorting step performs a row direction sorting process and a column direction sorting process. And generating alignment information indicating a relationship between cells for each cell.
【請求項2】 請求項1に記載の方法において、前記表
整列工程は、 前記行方向の整列処理を行う際、前記表領域における項
目を表す項目セルと、該項目セルによる項目行とを特定
し、 前記列方向の整列処理にて、前記項目行の各項目セルに
対応するデータ行におけるデータセルを特定する情報を
前記整列情報に記述することを特徴とする文字認識方
法。
2. The method according to claim 1, wherein in the table sorting step, when performing the row direction sorting process, an item cell representing an item in the table area and an item row by the item cell are specified. A character recognition method, characterized in that, in the alignment processing in the column direction, information for specifying a data cell in a data row corresponding to each item cell of the item row is described in the alignment information.
【請求項3】 請求項2に記載の方法において、前記表
整列工程は、各データセルにそれぞれ対応するデータセ
ルを特定する情報を前記整列情報に記述することを特徴
とする文字認識方法。
3. The character recognition method according to claim 2, wherein in the table sorting step, information for specifying a data cell corresponding to each data cell is described in the sorting information.
【請求項4】 請求項2に記載の方法において、前記表
整列工程は、 前記項目行における項目セルの入れ子状態を認識する工
程と、 前記認識した入れ子状態に応じて、該入れ子状態の項目
セルを表す複合セルを作成する工程とを含み、 前記認識工程は、前記複合セルに対応するデータセルに
ついて前記文字情報を認識することを特徴とする文字認
識方法。
4. The method according to claim 2, wherein the table sorting step includes: recognizing a nested state of the item cells in the item row; and responsive to the recognized nested state, the nested item cells. And a step of creating a composite cell representing the following. The character recognition method characterized in that the character information is recognized for a data cell corresponding to the composite cell.
【請求項5】 請求項2に記載の方法において、前記表
整列工程は、 前記データ行におけるデータセルを前記項目セルの幅に
応じて結合して結合セルを作成する工程を含み、 前記認識工程は、前記結合セルに対応する各データセル
について前記文字情報を認識することを特徴とする文字
認識方法。
5. The method according to claim 2, wherein the table alignment step includes a step of combining data cells in the data row according to a width of the item cell to create a combined cell, and the recognition step. Is a method of recognizing the character information for each data cell corresponding to the merged cell.
【請求項6】 請求項2に記載の方法において、前記表
整列工程は、 前記項目行における項目セルの入れ子状態を認識する工
程と、 前記認識した入れ子状態に応じて、該入れ子状態の項目
セルに対応するデータセルを前記項目セルの幅に応じて
特定する工程とを含み、 前記認識工程は、前記特定されるデータセルについて前
記文字情報を認識することを特徴とする文字認識方法。
6. The method according to claim 2, wherein the table sorting step includes: a step of recognizing a nesting state of an item cell in the item row; and a step of recognizing the nesting state according to the recognized nesting state. Identifying the data cell corresponding to the item cell according to the width of the item cell, wherein the recognizing step recognizes the character information for the identified data cell.
【請求項7】 情報記録媒体に記録された画像を読み取
って得られるイメージ情報に応じて、該イメージ情報に
対応する文字情報を認識する文字認識装置において、該
装置は、 前記イメージ情報を入力する入力手段と、 前記イメージ情報から罫線にて囲まれる表領域における
最小単位のセルを抽出し、該セルの位置を表す座標情報
を各セルごとに生成するセル抽出手段と、 前記表領域の構造を各セルを整列させて特定し、該構造
を表す整列情報を生成する表整列手段と、 前記座標情報および整列情報に基づいて、前記セルに対
応する前記イメージデータから前記文字情報を認識する
認識手段と、 該認識工程にて認識される文字情報を出力する認識結果
出力手段とを含み、 前記表整列手段は、列方向の整列処理と行方向の整列処
理とを行って、各セル間の関係を表す整列情報を各セル
についてそれぞれ生成することを特徴とする文字認識装
置。
7. A character recognition device for recognizing character information corresponding to image information according to image information obtained by reading an image recorded on an information recording medium, wherein the device inputs the image information. Input means, cell extracting means for extracting a minimum unit cell in a table area surrounded by ruled lines from the image information, and generating coordinate information for each cell for each cell, and a structure of the table area. Table aligning means for aligning and specifying each cell and generating alignment information representing the structure; and recognition means for recognizing the character information from the image data corresponding to the cell based on the coordinate information and the alignment information. And a recognition result output means for outputting character information recognized in the recognition step, wherein the table sorting means performs a column direction sorting process and a row direction sorting process. A character recognition device for generating alignment information representing a relationship between cells for each cell.
【請求項8】 請求項7に記載の装置において、前記表
整列手段は、 前記行方向の整列処理を行う際、前記表領域における項
目を表す項目セルと、該項目セルによる項目行とを特定
し、 前記列方向の整列処理にて、前記項目行の各項目セルに
対応するデータ行におけるデータセルを特定する情報を
前記整列情報に記述することを特徴とする文字認識装
置。
8. The apparatus according to claim 7, wherein the table sorting means specifies an item cell representing an item in the table area and an item row by the item cell when performing the row direction alignment processing. The character recognition device is characterized in that, in the alignment processing in the column direction, information for specifying a data cell in a data row corresponding to each item cell of the item row is described in the alignment information.
【請求項9】 請求項8に記載の装置において、前記表
整列手段は、各データセルにそれぞれ対応するデータセ
ルを特定する情報を前記整列情報に記述することを特徴
とする文字認識装置。
9. A character recognition apparatus according to claim 8, wherein said table sorting means describes information for specifying a data cell corresponding to each data cell in said sorting information.
【請求項10】 請求項8に記載の装置において、前記
表整列手段は、 前記項目行における項目セルの入れ子状態を認識する手
段と、 前記認識した入れ子状態に応じて、該入れ子状態の項目
セルを表す複合セルを作成する手段とを含み、 前記認識手段は、前記複合セルに対応するデータセルに
ついて前記文字情報を認識することを特徴とする文字認
識装置。
10. The apparatus according to claim 8, wherein said table sorting means includes means for recognizing a nested state of an item cell in said item row, and said nested item cell in accordance with said recognized nested state. Means for creating a composite cell representing the character information, wherein the recognizing means recognizes the character information for a data cell corresponding to the composite cell.
【請求項11】 請求項8に記載の装置において、前記
表整列手段は、 前記データ行におけるデータセルを前記項目セルの幅に
応じて結合して結合セルを作成する手段を含み、 前記認識手段は、前記結合セルに対応する各データセル
について前記文字情報を認識することを特徴とする文字
認識装置。
11. The apparatus according to claim 8, wherein said table sorting means includes means for combining data cells in said data row according to the width of said item cell to create a combined cell, and said recognizing means. Is a character recognition device for recognizing the character information for each data cell corresponding to the merged cell.
【請求項12】 請求項8に記載の装置において、前記
表整列手段は、 前記項目行における項目セルの入れ子状態を認識する手
段と、 前記認識した入れ子状態に応じて、該入れ子状態の項目
セルに対応するデータセルを前記項目セルの幅に応じて
特定する手段とを含み、 前記認識手段は、前記特定されるデータセルについて前
記文字情報を認識することを特徴とする文字認識装置。
12. The apparatus according to claim 8, wherein said table sorting means includes means for recognizing a nested state of an item cell in said item row, and said nested item cell in accordance with said recognized nested state. Means for specifying a data cell corresponding to the item cell in accordance with the width of the item cell, wherein the recognizing means recognizes the character information for the specified data cell.
【請求項13】 画像を読み取って得られるイメージ情
報に応じて、該イメージ情報に対応する文字情報を認識
する文字認識プログラムが記録されたコンピュータ読み
取り可能な情報記録媒体において、該情報記憶媒体は、 前記イメージ情報を入力する入力手順と、 前記イメージ情報から罫線にて囲まれる表領域における
最小単位のセルを抽出し、該セルの位置を表す座標情報
を各セルごとに生成するセル抽出手順と、 前記表領域の構造を各セルを整列させて特定し、該構造
を表す整列情報を生成する表整列手順と、 前記座標情報および整列情報に基づいて、前記セルに対
応する前記イメージデータから前記文字情報を認識する
認識手順と、 該認識工程にて認識される文字情報を出力する認識結果
出力手順とを含み、 前記表整列手順は、列方向の整列処理と行方向の整列処
理とを行って、各セル間の関係を表す整列情報を各セル
についてそれぞれ生成することを特徴とする文字認識プ
ログラムが記憶されたコンピュータ読み取り可能な情報
記録媒体。
13. A computer-readable information recording medium in which a character recognition program for recognizing character information corresponding to image information according to image information obtained by reading an image is recorded, wherein the information storage medium comprises: An input procedure of inputting the image information, a cell extraction procedure of extracting a minimum unit cell in a table area surrounded by ruled lines from the image information, and generating coordinate information representing the position of the cell for each cell, A table alignment procedure for identifying the structure of the table area by aligning the cells and generating alignment information representing the structure; and, based on the coordinate information and the alignment information, the character from the image data corresponding to the cell. A recognition procedure for recognizing information; and a recognition result output procedure for outputting character information recognized in the recognition step. A computer readable information recording medium storing a character recognition program, wherein a character recognition program is generated by performing a direction alignment process and a row direction alignment process to generate alignment information representing a relationship between cells. .
【請求項14】 請求項13に記載の情報記録媒体にお
いて、前記表整列手順は、 前記行方向の整列処理を行う際、前記表領域における項
目を表す項目セルと、該項目セルによる項目行とを特定
し、 前記列方向の整列処理にて、前記項目行の各項目セルに
対応するデータ行におけるデータセルを特定する情報を
前記整列情報に記述することを特徴とするコンピュータ
読み取り可能な情報記録媒体。
14. The information recording medium according to claim 13, wherein, in the table sorting procedure, when performing the row-wise alignment processing, an item cell representing an item in the table area, and an item row by the item cell. Computer-readable information recording, wherein, in the column direction alignment processing, information specifying a data cell in a data row corresponding to each item cell of the item row is described in the alignment information. Medium.
【請求項15】 請求項14に記載の情報記録媒体にお
いて、前記表整列手順は、各データセルにそれぞれ対応
するデータセルを特定する情報を前記整列情報に記述す
ることを特徴とするコンピュータ読み取り可能な情報記
録媒体。
15. The computer-readable medium according to claim 14, wherein said table alignment procedure describes information specifying a data cell corresponding to each data cell in said alignment information. Information recording medium.
【請求項16】 請求項14に記載の情報記録媒体にお
いて、前記表整列手順は、 前記項目行における項目セルの入れ子状態を認識する手
順と、 前記認識した入れ子状態に応じて、該入れ子状態の項目
セルを表す複合セルを作成する手順とを含み、 前記認識手順は、前記複合セルに対応するデータセルに
ついて前記文字情報を認識することを特徴とするコンピ
ュータ読み取り可能な情報記録媒体。
16. The information recording medium according to claim 14, wherein the table sorting step includes a step of recognizing a nested state of an item cell in the item row, and a step of recognizing the nested state according to the recognized nested state. Creating a composite cell representing an item cell, wherein the recognition step recognizes the character information for a data cell corresponding to the composite cell.
【請求項17】 請求項14に記載の情報記録媒体にお
いて、前記表整列手順は、 前記データ行におけるデータセルを前記項目セルの幅に
応じて結合して結合セルを作成する手順を含み、 前記認識手順は、前記結合セルに対応する各データセル
について前記文字情報を認識することを特徴とするコン
ピュータ読み取り可能な情報記録媒体。
17. The information recording medium according to claim 14, wherein the table sorting step includes a step of combining data cells in the data row according to a width of the item cell to create a combined cell. A computer-readable information recording medium, wherein the recognition step recognizes the character information for each data cell corresponding to the merged cell.
【請求項18】 請求項14に記載の情報記録媒体にお
いて、前記表整列手順は、 前記項目行における項目セルの入れ子状態を認識する手
順と、 前記認識した入れ子状態に応じて、該入れ子状態の項目
セルに対応するデータセルを前記項目セルの幅に応じて
特定する手順とを含み、 前記認識手順は、前記特定されるデータセルについて前
記文字情報を認識することを特徴とするコンピュータ読
み取り可能な情報記録媒体。
18. The information recording medium according to claim 14, wherein the table sorting step includes a step of recognizing a nesting state of an item cell in the item row, and a step of recognizing the nesting state according to the recognized nesting state. Specifying a data cell corresponding to the item cell in accordance with the width of the item cell, wherein the recognizing step recognizes the character information for the specified data cell. Information recording medium.
JP28951399A 1999-10-12 1999-10-12 Character recognition method and device Expired - Fee Related JP3435375B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP28951399A JP3435375B2 (en) 1999-10-12 1999-10-12 Character recognition method and device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP28951399A JP3435375B2 (en) 1999-10-12 1999-10-12 Character recognition method and device

Publications (2)

Publication Number Publication Date
JP2001109843A true JP2001109843A (en) 2001-04-20
JP3435375B2 JP3435375B2 (en) 2003-08-11

Family

ID=17744251

Family Applications (1)

Application Number Title Priority Date Filing Date
JP28951399A Expired - Fee Related JP3435375B2 (en) 1999-10-12 1999-10-12 Character recognition method and device

Country Status (1)

Country Link
JP (1) JP3435375B2 (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011233178A (en) * 2011-08-26 2011-11-17 Fuji Xerox Co Ltd Image processing device and program
JP2015219620A (en) * 2014-05-15 2015-12-07 富士ゼロックス株式会社 Information processor and information processing program
CN111695553A (en) * 2020-06-05 2020-09-22 北京百度网讯科技有限公司 Form recognition method, device, equipment and medium
CN112200117A (en) * 2020-10-22 2021-01-08 长城计算机软件与系统有限公司 Form identification method and device
CN112528703A (en) * 2019-09-17 2021-03-19 珠海金山办公软件有限公司 Method and device for identifying table structure and electronic equipment

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011233178A (en) * 2011-08-26 2011-11-17 Fuji Xerox Co Ltd Image processing device and program
JP2015219620A (en) * 2014-05-15 2015-12-07 富士ゼロックス株式会社 Information processor and information processing program
CN112528703A (en) * 2019-09-17 2021-03-19 珠海金山办公软件有限公司 Method and device for identifying table structure and electronic equipment
CN112528703B (en) * 2019-09-17 2023-11-03 珠海金山办公软件有限公司 Method and device for identifying table structure and electronic equipment
CN111695553A (en) * 2020-06-05 2020-09-22 北京百度网讯科技有限公司 Form recognition method, device, equipment and medium
CN111695553B (en) * 2020-06-05 2023-09-08 北京百度网讯科技有限公司 Form identification method, device, equipment and medium
CN112200117A (en) * 2020-10-22 2021-01-08 长城计算机软件与系统有限公司 Form identification method and device
CN112200117B (en) * 2020-10-22 2023-10-13 长城计算机软件与系统有限公司 Form identification method and device

Also Published As

Publication number Publication date
JP3435375B2 (en) 2003-08-11

Similar Documents

Publication Publication Date Title
US4933979A (en) Data reading apparatus for reading data from form sheet
EP0439951B1 (en) Data processing
US7391917B2 (en) Image processing method
US7664321B2 (en) Image processing method, system, program, program storage medium and information processing apparatus
CN102782702B (en) Paragraph recognition in an optical character recognition (OCR) process
US20010043740A1 (en) Character recognizing device, image reading device, character recognizing method, and program product
US6208744B1 (en) Document image processor and method for setting a document format conforming to a document image
US5191612A (en) Character recognition system
US20040213458A1 (en) Image processing method and system
US6937762B2 (en) Image processing device and program product
JP7337612B2 (en) Image processing device, image processing system, image processing method, and program
JP3178483B2 (en) Document processing device
US11941903B2 (en) Image processing apparatus, image processing method, and non-transitory storage medium
JPH11161736A (en) Method for recognizing character
EP1202213B1 (en) Document format identification apparatus and method
JP2001109843A (en) Method and device for character recognition
US7508986B2 (en) Document recognition device, document recognition method and program, and storage medium
JP2000322417A (en) Device and method for filing image and storage medium
JP3319203B2 (en) Document filing method and apparatus
US5854860A (en) Image filing apparatus having a character recognition function
US7016535B2 (en) Pattern identification apparatus, pattern identification method, and pattern identification program
JPS638889A (en) Information processor
JPH0333990A (en) Optical character recognition instrument and method using mask processing
JP4310176B2 (en) Image processing apparatus, image processing method, and program
KR102561878B1 (en) Ai blue ocr reading system and method based on machine learning

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030430

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080530

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090530

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100530

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100530

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110530

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120530

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130530

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140530

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees