JP3276555B2 - Format recognition device and character reader - Google Patents

Format recognition device and character reader

Info

Publication number
JP3276555B2
JP3276555B2 JP06497096A JP6497096A JP3276555B2 JP 3276555 B2 JP3276555 B2 JP 3276555B2 JP 06497096 A JP06497096 A JP 06497096A JP 6497096 A JP6497096 A JP 6497096A JP 3276555 B2 JP3276555 B2 JP 3276555B2
Authority
JP
Japan
Prior art keywords
format
ruled line
recognition
character
reference data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP06497096A
Other languages
Japanese (ja)
Other versions
JPH09259222A (en
Inventor
和弘 石川
惠太 岡田
浩一 樋口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP06497096A priority Critical patent/JP3276555B2/en
Publication of JPH09259222A publication Critical patent/JPH09259222A/en
Application granted granted Critical
Publication of JP3276555B2 publication Critical patent/JP3276555B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】この発明は、帳票フォーマッ
トの種別を認識するフォーマット認識装置と、帳票フォ
ーマットの種別を認識しその認識結果に応じた文字読取
りを行なう文字読取り装置とに関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a format recognizing device for recognizing the type of a form format, and a character reading device for recognizing the type of a form format and reading characters according to the recognition result.

【0002】[0002]

【従来の技術】文字記入された帳票の文字読取りを行な
う装置においては、一般に、各帳票フォーマットの種別
に対応した読取り制御データを用いて文字パタンを切出
し認識することが行なわれている(例えば文献「橋本新
一郎 編著、文字認識概論 p203〜206 昭和5
7年3月20日、オーム社」参照)。文字パタンの切出
しには例えば文字行の位置、フィールドの位置及び個
数、文字のピッチ及び個数が、また文字パタンの認識に
は例えば文字種、字体が、読取り制御データに用いられ
る。従来一般に、この種の装置に供する帳票には各帳票
フォーマットの各種別毎に設定された帳票種別番号が印
刷されており、この種別番号の認識結果に基づいて読取
り制御データを読み出している。
2. Description of the Related Art In an apparatus for reading characters in a form in which characters are written, generally, a character pattern is cut out and recognized using read control data corresponding to the type of each form format (for example, see References). "Edited by Shinichiro Hashimoto, Introduction to Character Recognition, p. 203-206, Showa 5
March 20, 2007, Ohmsha "). For example, the position of a character line, the position and number of fields, and the pitch and number of characters are used for extracting a character pattern, and the character type and font are used for reading control data for recognizing a character pattern. Conventionally, a form type number set for each type of form format is printed on a form provided to this type of apparatus, and read control data is read based on the recognition result of the type number.

【0003】[0003]

【発明が解決しようとする課題】しかしながら帳票のな
かには、帳票種別番号が印刷されていないものもある。
例えば振込依頼書などの私製の帳票や、市販の一般伝票
には、帳票種別番号が印刷されておらず、従って上述し
た従来装置では、この種の帳票につき文字パタンの切出
し及び認識を行なう場合に、読取り制御データを利用で
きない。
However, some forms have no form type number printed thereon.
For example, a private form such as a transfer request form or a commercial general form does not have a form type number printed thereon.Therefore, in the above-described conventional apparatus, when a character pattern is cut out and recognized for this kind of form, , No read control data is available.

【0004】そこでこの出願の発明者等は種々の検討を
行った結果、帳票フォーマットに関わる罫線を利用すれ
ば、帳票種別番号が印刷されていない場合でも、帳票フ
ォーマットの種別を認識できることに気付いた。
[0004] The inventors of the present application have conducted various studies, and have found that the use of the ruled lines related to the form format allows the form format type to be recognized even when the form type number is not printed. .

【0005】この出願はこのような点に鑑み成されたも
のであり、この出願の第一の目的は、帳票フォーマット
に関わる罫線を利用して帳票フォーマットの種別を認識
する帳票フォーマット認識装置と、帳票フォーマットに
関わる罫線を利用して帳票フォーマットの種別を認識し
この認識結果に対応した読取り制御データを用いて文字
パタンの切出し及び認識を行なう文字読取り装置とを提
供することにある。
The present application has been made in view of the above points, and a first object of the present application is to provide a form format recognition device for recognizing the type of a form format using ruled lines related to the form format, It is an object of the present invention to provide a character reading device that recognizes the type of a form using a ruled line related to the form, and cuts out and recognizes a character pattern using read control data corresponding to the recognition result.

【0006】このような帳票フォーマットの認識技術に
類似する技術として、例えば特開平4−158487号
公報に開示されている表認識装置がある。この装置は、
表の構造及び内部の文字を認識する装置であって、連結
黒画素の外接矩形リストを作成する手段、外接矩形の辺
の長さから矩形内の連結黒画素が文字であるか否かを推
定する手段、この推定結果に基づいて矩形内の文字認識
を行なう手段、矩形内の文字を文字認識終了後に消去す
る手段、矩形内の文字消去後に黒画素のヒストグラムか
ら罫線の位置を推定し、推定した罫線位置に基づきイメ
ージデータを部分的に走査して表を構成する罫線の位置
を認識する手段とを備える。
As a technique similar to such a form format recognition technique, there is, for example, a table recognition apparatus disclosed in Japanese Patent Application Laid-Open No. 4-158487. This device is
Apparatus for recognizing the structure of a table and the characters in the table, means for creating a circumscribed rectangle list of connected black pixels, and estimating whether or not the connected black pixels in the rectangle are characters from the length of the sides of the circumscribed rectangle Means for performing character recognition in a rectangle based on the estimation result; means for erasing characters in a rectangle after character recognition is completed; and estimating and estimating the position of a ruled line from a histogram of black pixels after character erasure in the rectangle. Means for partially scanning the image data based on the determined ruled line positions to recognize the positions of the ruled lines forming the table.

【0007】しかしながらこの表認識装置は、表を構成
する各罫線の位置を認識するに留まるものであって、読
取り制御データの選択のために罫線を利用して帳票フォ
ーマットの種別を認識するものではない。従って読取り
制御データを用いることができないので、読取りを行な
いたい特定の領域の文字パタンだけを切り出して認識す
るということは、できない。
However, this table recognizing apparatus only recognizes the position of each ruled line constituting the table, but does not recognize the type of the form format using the ruled line for selecting the read control data. Absent. Therefore, since the read control data cannot be used, it is impossible to cut out and recognize only the character pattern of a specific area to be read.

【0008】[0008]

【課題を解決するための手段】第1の発明に係るフォー
マット認識装置は、帳票フォーマット未知の帳票イメー
ジデータから、帳票フォーマットを表す罫線パタンを抽
出する罫線抽出部と、抽出された罫線パタンを格納する
罫線パタンメモリと、帳票フォーマットの辞書データを
保持するフォーマット認識辞書と、抽出された罫線パタ
ンを、帳票フォーマットの辞書データと照合し、該照合
結果に基づいて罫線パタンにより表される帳票フォーマ
ットについて一又は複数の認識結果を出力するフォーマ
ット認識部と、既知の帳票フォーマットの特徴を表す参
照データを保持する参照データメモリと、帳票フォーマ
ットの認識結果に対応した既知の帳票フォーマットの参
照データを表示する表示部と、オペレータが表示された
参照データに基づいて帳票フォーマットの認識結果を決
定する作業において、オペレータによる決定結果の入力
操作に対応したフォーマット決定信号を出力する入力デ
バイスとを備えるフォーマット認識装置において、種類
の異なる参照データを、図形、記号、文字、色、輝度若
しくはこれらの組み合わせを異ならせることにより区別
して表示することを特徴とする。
According to a first aspect of the present invention, there is provided a format recognition apparatus for extracting a ruled line pattern representing a form format from form image data of an unknown form format, and storing the extracted ruled line pattern. A ruled line pattern memory, a format recognition dictionary that holds form format dictionary data, and a collation of extracted ruled line patterns with form format dictionary data, and a form format represented by the ruled line pattern based on the matching result. A format recognition unit that outputs one or a plurality of recognition results, a reference data memory that holds reference data representing characteristics of a known form format, and a reference data of a known form format corresponding to the recognition result of the form format. The display unit and the operator display the reference data based on the displayed reference data. An input device that outputs a format determination signal corresponding to an input operation of the determination result by an operator in the operation of determining the recognition result of the form format by using a reference data of different types, , Colors, brightness, or a combination thereof, so as to be distinguished and displayed.

【0009】第2の発明に係るフォーマット認識装置
は、帳票フォーマット未知の帳票イメージデータから、
帳票フォーマットを表す罫線パタンを抽出する罫線抽出
部と、抽出された罫線パタンを格納する罫線パタンメモ
リと、帳票フォーマットの辞書データを保持するフォー
マット認識辞書と、抽出された罫線パタンを、帳票フォ
ーマットの辞書データと照合し、該照合結果に基づいて
罫線パタンにより表される帳票フォーマットについて一
又は複数の認識結果を出力するフォーマット認識部と、
既知の帳票フォーマットの特徴を表す参照データを保持
する参照データメモリと、前記帳票フォーマットの認識
結果に対応した既知の帳票フォーマットの参照データを
表示する表示部と、オペレータが表示された参照データ
に基づいて帳票フォーマットの認識結果を決定する作業
において、オペレータによる決定結果の入力操作に対応
したフォーマット決定信号を出力する入力デバイスとを
備えるフォーマット認識装置において、図形により表し
た帳票、行及びフィールドを、参照データとして表示す
ることを特徴とする。
A format recognition apparatus according to a second aspect of the present invention converts form image data of an unknown form
A ruled line extraction unit that extracts a ruled line pattern representing a form format, a ruled line pattern memory that stores the extracted ruled line pattern, a format recognition dictionary that holds dictionary data in the form format, and an extracted ruled line pattern A format recognition unit that checks against dictionary data and outputs one or more recognition results for a form format represented by a ruled line pattern based on the check result;
A reference data memory for holding reference data representing characteristics of a known form format, a display unit for displaying reference data of a known form format corresponding to the recognition result of the form format, and an operator based on the displayed reference data. In the operation of determining the recognition result of the form format by using a format recognition device having an input device for outputting a format determination signal corresponding to the input operation of the determination result by the operator, the form, the line and the field represented by the graphic are referred to. It is characterized by being displayed as data.

【0010】第3の発明に係るフォーマット認識装置
は、帳票フォーマット未知の帳票イメージデータから、
帳票フォーマットを表す罫線パタンを抽出する罫線抽出
部と、抽出された罫線パタンを格納する罫線パタンメモ
リと、帳票フォーマットの辞書データを保持するフォー
マット認識辞書と、抽出された罫線パタンを、帳票フォ
ーマットの辞書データと照合し、該照合結果に基づいて
罫線パタンにより表される帳票フォーマットについて一
又は複数の認識結果を出力するフォーマット認識部と、
既知の帳票フォーマットの特徴を表す参照データを保持
する参照データメモリと、前記帳票フォーマットの認識
結果に対応した既知の帳票フォーマットの参照データを
表示する表示部と、オペレータが表示された参照データ
に基づいて帳票フォーマットの認識結果を決定する作業
において、オペレータによる決定結果の入力操作に対応
したフォーマット決定信号を出力する入力デバイスとを
備えるフォーマット認識装置において、参照データを、
帳票幅、帳票高さ、帳票内の行数、帳票内の行位置、帳
票内のフィールド数、帳票内のフィールド位置、前記行
内若しくはフィールド内の文字数、前記行内若しくはフ
ィールド内の文字ピッチ、前記行内若しくはフィールド
内の文字の字体、及び、前記行内若しくはフィールド内
の文字の字種のなかから選んだ一又は複数の参照データ
としたことを特徴とする。
A format recognition apparatus according to a third aspect of the present invention converts form image data of an unknown form
A ruled line extraction unit that extracts a ruled line pattern representing a form format, a ruled line pattern memory that stores the extracted ruled line pattern, a format recognition dictionary that holds dictionary data in the form format, and an extracted ruled line pattern A format recognition unit that checks against dictionary data and outputs one or more recognition results for a form format represented by a ruled line pattern based on the check result;
A reference data memory for holding reference data representing characteristics of a known form format, a display unit for displaying reference data of a known form format corresponding to the recognition result of the form format, and an operator based on the displayed reference data. In the operation of determining the recognition result of the form format, in the format recognition device having an input device that outputs a format determination signal corresponding to the input operation of the determination result by the operator, the reference data,
Form width, form height, number of lines in the form, line position in the form, number of fields in the form, field position in the form, number of characters in the line or field, character pitch in the line or field, in the line Alternatively, one or a plurality of reference data selected from the font of the character in the field and the character type of the character in the line or the field is provided.

【0011】第4の発明に係るフォーマット認識装置
は、帳票フォーマット未知の帳票イメージデータから、
帳票フォーマットを表す罫線パタンを抽出する罫線抽出
部と、抽出された罫線パタンを格納する罫線パタンメモ
リと、帳票フォーマットの辞書データを保持するフォー
マット認識辞書と、抽出された罫線パタンを、帳票フォ
ーマットの辞書データと照合し、該照合結果に基づいて
罫線パタンにより表される帳票フォーマットについて一
又は複数の認識結果を出力するフォーマット認識部と、
既知の帳票フォーマットの特徴を表す参照データを保持
する参照データメモリと、前記帳票フォーマットの認識
結果に対応した既知の帳票フォーマットの参照データを
表示する表示部と、オペレータが表示された参照データ
に基づいて帳票フォーマットの認識結果を決定する作業
において、オペレータによる決定結果の入力操作に対応
したフォーマット決定信号を出力する入力デバイスとを
備えるフォーマット認識装置において、第一の参照デー
タを、帳票内の行数、帳票内の行位置、帳票内のフィー
ルド数、及び、帳票内のフィールド位置のなかから選ん
だ一又は複数の参照データとし、第二の参照データを、
帳票内の文字の字体及び帳票内の文字の字種のなかから
選んだ一又は複数の参照データとし、第二の参照データ
を、第一の参照データの表示位置の近傍位置若しくは第
一の参照データの表示位置と重なる位置に、表示するこ
とを特徴とする。
According to a fourth aspect of the present invention, a format recognition device converts form image data of an unknown form format from form image data.
A ruled line extraction unit that extracts a ruled line pattern representing a form format, a ruled line pattern memory that stores the extracted ruled line pattern, a format recognition dictionary that holds dictionary data in the form format, and an extracted ruled line pattern A format recognition unit that checks against dictionary data and outputs one or more recognition results for a form format represented by a ruled line pattern based on the check result;
A reference data memory for holding reference data representing characteristics of a known form format, a display unit for displaying reference data of a known form format corresponding to the recognition result of the form format, and an operator based on the displayed reference data. An input device that outputs a format determination signal corresponding to an input operation of the determination result by an operator in the operation of determining the recognition result of the form format by using the first reference data as the number of lines in the form. , Line position in the form, the number of fields in the form, and one or more reference data selected from the field position in the form, the second reference data,
One or a plurality of reference data selected from the font of the character in the form and the character type of the character in the form, and the second reference data is a position near the display position of the first reference data or the first reference data. The data is displayed at a position overlapping the data display position.

【0012】第5の発明に係るフォーマット認識装置
は、帳票フォーマット未知の帳票イメージデータから、
帳票フォーマットを表す罫線パタンを抽出する罫線抽出
部と、抽出された罫線パタンを格納する罫線パタンメモ
リと、帳票フォーマットの辞書データを保持するフォー
マット認識辞書と、抽出された罫線パタンを、帳票フォ
ーマットの辞書データと照合し、該照合結果に基づいて
罫線パタンにより表される帳票フォーマットについて一
又は複数の認識結果を出力するフォーマット認識部と、
既知の帳票フォーマットの特徴を表す参照データを保持
する参照データメモリと、前記帳票フォーマットの認識
結果に対応した既知の帳票フォーマットの参照データを
表示する表示部と、オペレータが表示された参照データ
に基づいて帳票フォーマットの認識結果を決定する作業
において、オペレータによる決定結果の入力操作に対応
したフォーマット決定信号を出力する入力デバイスとを
備えるフォーマット認識装置において、図形により表し
た行を、第一の参照データとして表示し、行内の文字の
字種若しくは字体を、第二の参照データとして表示し、
第二の参照データを、第一の参照データの表示位置の近
傍位置若しくは第一の参照データの表示位置と重なる位
置に、表示することを特徴とする。
According to a fifth aspect of the present invention, a format recognizing apparatus converts form image data of an unknown form format from form image data.
A ruled line extraction unit that extracts a ruled line pattern representing a form format, a ruled line pattern memory that stores the extracted ruled line pattern, a format recognition dictionary that holds dictionary data in the form format, and an extracted ruled line pattern A format recognition unit that checks against dictionary data and outputs one or more recognition results for a form format represented by a ruled line pattern based on the check result;
A reference data memory for holding reference data representing characteristics of a known form format, a display unit for displaying reference data of a known form format corresponding to the recognition result of the form format, and an operator based on the displayed reference data. In a format recognition apparatus having an input device for outputting a format determination signal corresponding to an input operation of a determination result by an operator in a work of determining a recognition result of a form format, a row represented by a graphic is referred to as first reference data. , And the character type or font of the characters in the line is displayed as the second reference data,
The second reference data is displayed at a position near the display position of the first reference data or at a position overlapping with the display position of the first reference data.

【0013】第6の発明に係るフォーマット認識装置
は、帳票フォーマット未知の帳票イメージデータから、
帳票フォーマットを表す罫線パタンを抽出する罫線抽出
部と、抽出された罫線パタンを格納する罫線パタンメモ
リと、帳票フォーマットの辞書データを保持するフォー
マット認識辞書と、抽出された罫線パタンを、帳票フォ
ーマットの辞書データと照合し、該照合結果に基づいて
罫線パタンにより表される帳票フォーマットについて一
又は複数の認識結果を出力するフォーマット認識部と、
既知の帳票フォーマットの特徴を表す参照データを保持
する参照データメモリと、前記帳票フォーマットの認識
結果に対応した既知の帳票フォーマットの参照データを
表示する表示部と、オペレータが表示された参照データ
に基づいて帳票フォーマットの認識結果を決定する作業
において、オペレータによる決定結果の入力操作に対応
したフォーマット決定信号を出力する入力デバイスとを
備えるフォーマット認識装置において、図形により表し
たフィールドを、第一の参照データとして表示し、フィ
ールド内の文字の字種若しくは字体を、第二の参照デー
タとして表示し、第二の参照データを、第一の参照デー
タの表示位置の近傍位置若しくは第一の参照データの表
示位置と重なる位置に、表示することを特徴とする。
A format recognition apparatus according to a sixth aspect of the present invention converts form image data of an unknown form
A ruled line extraction unit that extracts a ruled line pattern representing a form format, a ruled line pattern memory that stores the extracted ruled line pattern, a format recognition dictionary that holds dictionary data in the form format, and an extracted ruled line pattern A format recognition unit that checks against dictionary data and outputs one or more recognition results for a form format represented by a ruled line pattern based on the check result;
A reference data memory for holding reference data representing characteristics of a known form format, a display unit for displaying reference data of a known form format corresponding to the recognition result of the form format, and an operator based on the displayed reference data. An input device that outputs a format determination signal corresponding to an input operation of the determination result by an operator in the operation of determining the recognition result of the form format by using a field represented by a graphic as first reference data. And the character type or font of the character in the field is displayed as the second reference data, and the second reference data is displayed in the vicinity of the display position of the first reference data or the display of the first reference data. It is characterized in that it is displayed at a position overlapping the position.

【0014】第3〜第6の発明においては、帳票フォー
マット未知の帳票イメージデータと、当該イメージデー
タに対応する前記参照データとを、重ね合わせて表示す
ることが望ましい。
In the third to sixth aspects of the present invention, it is preferable that form image data of an unknown form format and the reference data corresponding to the image data are displayed in a superimposed manner.

【0015】第3〜第6の発明においては、帳票フォー
マットが既知の帳票から予め得た参照用イメージデータ
と、前記参照データとを、重ね合わせて表示することが
望ましい。
In the third to sixth aspects of the present invention, it is desirable that the reference image data obtained in advance from a form having a known form format and the reference data be superimposed and displayed.

【0016】第7の発明に係るフォーマット認識装置
は、帳票フォーマットの認識処理を行なうフォーマット
認識系と、読取り制御データを保持する制御データメモ
リと、帳票フォーマットの認識結果に対応した読取り制
御データに従って文字の認識処理を行なう文字認識系と
を備え、文字認識系は、帳票イメージデータから文字パ
タンを切り出す文字切出し部と、切り出された文字パタ
ンを格納する文字パタンメモリと、文字の辞書データを
保持する文字認識辞書と、切り出された文字パタンを、
文字の辞書データと照合し、該照合結果に基づいて文字
パタンを認識する文字認識部とを備え、フォーマット認
識系を、帳票フォーマット未知の帳票イメージデータか
ら、帳票フォーマットを表す罫線パタンを抽出する罫線
抽出部と、抽出された罫線パタンを格納する罫線パタン
メモリと、帳票フォーマットの辞書データを保持するフ
ォーマット認識辞書と、抽出された罫線パタンを、帳票
フォーマットの辞書データと照合し、該照合結果に基づ
いて罫線パタンにより表される帳票フォーマットについ
て一又は複数の認識結果を出力するフォーマット認識部
とにより構成し、既知の帳票フォーマットの特徴を表す
参照データを保持する参照データメモリと、前記帳票フ
ォーマットの認識結果に対応した既知の帳票フォーマッ
トの参照データを表示する表示部と、オペレータが表示
された参照データに基づいて帳票フォーマットの認識結
果を決定する作業において、オペレータによる決定結果
の入力操作に対応したフォーマット決定信号を出力する
入力デバイスとを設け、文字認識系は、フォーマット決
定信号に対応する読取り制御データに従って、文字の認
識処理を行なうことを特徴とする文字読取り装置におい
て、参照データメモリを、制御データメモリとし、表示
部は、参照データとして読取り制御データを表示するこ
とを特徴とする。
A format recognition apparatus according to a seventh aspect of the present invention comprises a format recognition system for performing a form format recognition process, a control data memory for holding read control data, and a character recognition unit according to the read control data corresponding to the form format recognition result. The character recognition system has a character extracting unit that extracts a character pattern from the form image data, a character pattern memory that stores the extracted character pattern, and character dictionary data. The character recognition dictionary and the extracted character pattern
A character recognizing unit for collating with character dictionary data and recognizing a character pattern based on the collation result; and a format recognition system for extracting a ruled line pattern representing a form format from form image data of an unknown form format. The extraction unit, a ruled line pattern memory for storing the extracted ruled line pattern, a format recognition dictionary for holding the dictionary data in the form format, and the extracted ruled line pattern are collated with the dictionary data in the form format. A format recognition unit that outputs one or a plurality of recognition results for a form format represented by a ruled line pattern based on the reference data memory that holds reference data representing characteristics of a known form format; Reference data in a known form format corresponding to the recognition result A display unit for displaying, and an input device for outputting a format determination signal corresponding to the input operation of the determination result by the operator in the operation of determining the recognition result of the form format based on the reference data displayed by the operator, In the character reading device, the recognition system performs a character recognition process in accordance with the read control data corresponding to the format determination signal. In the character reading device, the reference data memory is a control data memory, and the display unit controls the reading as the reference data. Displaying data.

【0017】第1〜第7の発明によれば、作業効率に優
れ且つ作業の正確性を確保し易いフォーマット認識装置
を得ることができる。
According to the first to seventh aspects of the present invention, it is possible to obtain a format recognizing apparatus which is excellent in work efficiency and easily secures work accuracy.

【0018】[0018]

【0019】[0019]

【0020】[0020]

【0021】[0021]

【0022】[0022]

【0023】[0023]

【0024】[0024]

【0025】[0025]

【0026】[0026]

【0027】[0027]

【0028】[0028]

【発明の実施の形態】図1は文字読取り装置の構成を概
略的に示す機能ブロック図である。同図に示す文字読取
り装置は、請求項9の文字読取り装置の実施形態となる
ものであって、請求項1のフォーマット認識装置の実施
形態を含んでいる。以下の説明では、請求項9の文字読
取り装置の実施形態の説明と共に、請求項1のフォーマ
ット認識装置の実施形態につき説明する。
FIG. 1 is a functional block diagram schematically showing a configuration of a character reading device. The character reading device shown in the figure is an embodiment of the character reading device of claim 9 and includes an embodiment of the format recognition device of claim 1. In the following description, an embodiment of the format recognition apparatus of claim 1 will be described together with an embodiment of the character reading apparatus of claim 9.

【0029】同図に示す文字読取り装置10は、帳票フ
ォーマットの認識処理を行なうフォーマット認識系12
と、読取り制御データを保持する制御データメモリ14
と、帳票フォーマットの認識結果に対応した読取り制御
データに従って文字の認識処理を行なう文字認識系16
と、制御部17とを備える。
A character reading apparatus 10 shown in FIG. 1 has a format recognition system 12 for recognizing a form format.
And a control data memory 14 for holding read control data.
And a character recognition system 16 for performing character recognition processing according to read control data corresponding to the form format recognition result.
And a control unit 17.

【0030】フォーマット認識系12を、帳票フォーマ
ット未知の帳票イメージデータから、帳票フォーマット
を表す罫線パタンを抽出する罫線抽出部18と、抽出さ
れた罫線パタンを格納する罫線パタンメモリ20と、帳
票フォーマットの辞書データを保持するフォーマット認
識辞書22と、抽出された罫線パタンを、パターンマッ
チング法により、帳票フォーマットの辞書データと照合
し、該照合結果に基づいて罫線パタンにより表される帳
票フォーマットについて一又は複数の認識結果を出力す
るフォーマット認識部24とにより構成する。
The format recognition system 12 includes a ruled line extraction unit 18 for extracting a ruled line pattern representing a form format from form image data of an unknown form format, a ruled line pattern memory 20 for storing the extracted ruled line pattern, The format recognition dictionary 22 holding the dictionary data and the extracted ruled line pattern are collated with the dictionary data in the form format by the pattern matching method, and one or a plurality of the form formats represented by the ruled line pattern are determined based on the collation result. And a format recognizing unit 24 that outputs the recognition result.

【0031】そして既知の帳票フォーマットの特徴を表
す参照データを保持する参照データメモリ26と、前記
帳票フォーマットの認識結果に対応した既知の帳票フォ
ーマットの参照データを表示する表示部28と、オペレ
ータが表示された参照データに基づいて帳票フォーマッ
トの認識結果を決定する作業において、オペレータによ
る決定結果の入力操作に対応したフォーマット決定信号
を出力する入力デバイス30とを設ける。
A reference data memory 26 for holding reference data representing characteristics of the known form format, a display unit 28 for displaying reference data of the known form format corresponding to the recognition result of the form format, An input device 30 for outputting a format determination signal corresponding to an input operation of the determination result by the operator in the operation of determining the recognition result of the form format based on the obtained reference data.

【0032】文字認識系16は、帳票イメージデータか
ら文字パタンを切り出す文字切出し部32と、切り出さ
れた文字パタンを格納する文字パタンメモリ34と、文
字の辞書データを保持する文字認識辞書36と、切り出
された文字パタンを、パターンマッチング法により、文
字の辞書データと照合し、該照合結果に基づいて文字パ
タンを認識する文字認識部38とを備え、この文字認識
系16は、フォーマット決定信号に対応する読取り制御
データに従って、文字の認識処理を行なう。
The character recognition system 16 includes a character extraction unit 32 for extracting a character pattern from the form image data, a character pattern memory 34 for storing the extracted character pattern, a character recognition dictionary 36 for storing character dictionary data, The extracted character pattern is compared with character dictionary data by a pattern matching method, and a character recognizing unit 38 for recognizing the character pattern based on the result of the comparison is provided. Character recognition processing is performed according to the corresponding read control data.

【0033】制御部17は、フォーマット認識系12及
び文字認識系16の動作制御と、表示部28の表示制御
とを行なう。
The control unit 17 controls the operation of the format recognition system 12 and the character recognition system 16 and controls the display of the display unit 28.

【0034】(フォーマット認識の原理的な説明)図2
は帳票の一例を示す平面図である。図2(A)に示す帳
票40の紙面40a上には、帳票フォーマットの種別を
表す識別番号42(図示例では01234で表される5
桁の数字)と、所定事項が記載される領域を区分する罫
線44と、書き込まれるべき所定事項の属性を表す文字
46(図示例では01、02で表される文字)と、所定
事項を伝達すべく書き込まれた文字48(図示例ではA
BC、あいうえお、DEF、かきくけこ、アイウエオカ
キクケコで表される文字)とが記載されている。識別番
号42、罫線44及び文字46は帳票使用前に予め印刷
されていたものであり、また文字48は帳票使用時に書
き加えられたものである。文字48の書き加えられた領
域は、それ以前には空白となっている。
(Principle Explanation of Format Recognition) FIG.
Is a plan view showing an example of a form. On the paper surface 40a of the form 40 shown in FIG. 2A, an identification number 42 indicating the type of the form format (5 in the example shown in FIG. 2).
(A digit number), a ruled line 44 for dividing an area where a predetermined item is described, a character 46 (characters represented by 01 and 02 in the illustrated example) indicating an attribute of the predetermined item to be written, and the predetermined item are transmitted. Characters 48 written in order to save
BC, AIUEO, DEF, Kakikukeko, and Aioka Kikukuke). The identification number 42, the ruled line 44, and the character 46 are printed in advance before using the form, and the character 48 is added when the form is used. The area where the character 48 is added is blank before that.

【0035】罫線44を印刷することにより、紙面40
aを複数の領域50に区分し、罫線44によって区分さ
れた各区分領域50に、所定事項を記載する。尚、所定
事項は、文字、記号、図形そのほか種々のものにより表
すことができる。
By printing the ruled line 44, the paper 40
a is divided into a plurality of regions 50, and predetermined items are described in each of the divided regions 50 divided by the ruled lines 44. The predetermined items can be represented by characters, symbols, figures, and various other things.

【0036】帳票フォーマットは、罫線44によって区
分された区分領域50の形態(例えば紙面40a上に存
在する区分領域50の大きさ、個数及び形状や、各区分
領域50の相対的位置関係)を表したものである。
The form format indicates the form (for example, the size, number, and shape of the divided areas 50 existing on the paper surface 40a, and the relative positional relationship between the divided areas 50) divided by the ruled lines 44. It was done.

【0037】図2(B)に示す帳票40は、図2(A)
の帳票40と同じ用途に供するものであって、紙面40
a上に識別番号42を記載していないほかは、図2
(A)の帳票40と全く同様となっている。図2(B)
及び(A)にも示すように、同じ用途に供する帳票にあ
っては、識別番号42の有無に相違があっても殆どの場
合、同じ帳票フォーマットを用いるか、極めて類似した
帳票フォーマットを用いる。
The form 40 shown in FIG. 2B corresponds to the form 40 shown in FIG.
Is used for the same purpose as the form 40 of the
2 except that the identification number 42 is not described on FIG.
This is exactly the same as the form 40 in FIG. FIG. 2 (B)
As shown in (A) and (A), in the forms used for the same purpose, in most cases, the same form format or a very similar form format is used even if the presence or absence of the identification number 42 is different.

【0038】従って識別番号42を記載していない図2
(B)の帳票40であっても、帳票イメージデータから
罫線パタンを抽出し、抽出した罫線パタンにより表され
る帳票フォーマットを認識することにより、帳票フォー
マットの種別を知ることができる。
Therefore, FIG.
Even in the form 40 of (B), the type of the form format can be known by extracting the ruled line pattern from the form image data and recognizing the form format represented by the extracted ruled line pattern.

【0039】(全体的な動作の流れ)次に文字読取り装
置の全体的な動作の流れにつき説明する。図3はこの実
施形態の文字読取り装置の全体的な動作の流れを示す図
である。
(Overall Operation Flow) Next, the overall operation flow of the character reader will be described. FIG. 3 is a diagram showing the overall operation flow of the character reading device of this embodiment.

【0040】まずスキャナ52により帳票イメージデー
タを得る。スキャナ52は帳票40の紙面40aを光学
的に走査して、量子化された電気信号例えば白黒2値の
電気信号から成る帳票イメージデータを生成し、このデ
ータを帳票イメージメモリ54に格納する。ここでは線
描画素を黒ビットで、背景画素を白ビットで表す。線描
画素は紙面40a内に在る線を表す画素、背景画素は紙
面40aの地の部分(線の背景となる部分)を表す画素
である。スキャナ52にセットした帳票40を押える押
え面は帳票40の紙面40aの地と同様に背景画素に変
換される色例えば白色となっており、従ってここでは押
え面も白ビットで表わされる。
First, form image data is obtained by the scanner 52. The scanner 52 optically scans the paper surface 40a of the form 40, generates form image data composed of quantized electric signals, for example, black and white binary electric signals, and stores the data in the form image memory 54. Here, a line drawing element is represented by a black bit, and a background pixel is represented by a white bit. The line drawing element is a pixel representing a line in the paper surface 40a, and the background pixel is a pixel representing a ground portion (a portion serving as a line background) of the paper surface 40a. The pressing surface for pressing the form 40 set on the scanner 52 has a color, for example, white, which is converted into a background pixel, like the ground on the paper surface 40a of the form 40. Therefore, the pressing surface is also represented by a white bit here.

【0041】帳票イメージメモリ54に帳票イメージデ
ータが格納されると、制御部17は罫線抽出部18を起
動する(開始)。
When the form image data is stored in the form image memory 54, the control unit 17 activates the ruled line extraction unit 18 (start).

【0042】起動された罫線抽出部18は、帳票イメー
ジメモリ54に格納されている帳票イメージデータを走
査して、罫線パタンを抽出し、抽出した罫線パタンを罫
線パタンメモリ20に格納する(S1)。
The activated ruled line extracting unit 18 scans the form image data stored in the form image memory 54 to extract ruled line patterns, and stores the extracted ruled line patterns in the ruled line pattern memory 20 (S1). .

【0043】罫線抽出部18が罫線パタンの抽出を終了
すると、制御部17はフォーマット認識部24を起動す
る。
When the ruled line extraction unit 18 finishes extracting the ruled line pattern, the control unit 17 activates the format recognition unit 24.

【0044】起動されたフォーマット認識部24は、罫
線パタンメモリ20に格納されている罫線パタンを、フ
ォーマット認識辞書22に格納されている帳票フォーマ
ットの辞書データと照合し(S2)、この照合結果に基
づいて、罫線パタンにより表される帳票フォーマットを
認識し、この認識結果を制御部17へ出力する(S
3)。
The activated format recognition unit 24 compares the ruled line pattern stored in the ruled line pattern memory 20 with the form data dictionary data stored in the format recognition dictionary 22 (S2). Based on this, the form format represented by the ruled line pattern is recognized, and this recognition result is output to the control unit 17 (S
3).

【0045】制御部17は、入力した帳票フォーマット
の認識結果に対応した読取り制御データを既知の帳票フ
ォーマットの参照データとして参照データメモリ26
(14)から読み出し、読み出した参照データを表示部
28に表示させると共に、当該認識結果を得た帳票フォ
ーマット未知の帳票イメージデータを帳票イメージメモ
リ54から読み出し表示部28に表示させ(S4)、然
る後、オペレータによるフォーマット決定信号の入力を
待つ(S5)。
The control unit 17 converts the read control data corresponding to the input form format recognition result into reference data memory 26 as reference data of a known form format.
From (14), the read reference data is displayed on the display unit 28, and the form image data of unknown form format obtained from the recognition result is read from the form image memory 54 and displayed on the display unit 28 (S4). After that, it waits for the input of the format determination signal by the operator (S5).

【0046】オペレータは、参照データと帳票フォーマ
ット未知の帳票イメージデータとを比較参照し、最も確
からしい認識結果を判断決定し、入力デバイス30を操
作して、その判断結果に対応したフォーマット決定信号
を入力する。
The operator compares and refers to the reference data and the form image data whose form format is unknown, determines and determines the most probable recognition result, and operates the input device 30 to generate a format determination signal corresponding to the determined result. input.

【0047】制御部17は、オペレータによるフォーマ
ット決定信号の入力を確認すると(S5)、フォーマッ
ト決定信号に基づいて、読取り制御データの受け渡しを
行なう(S6)。この受け渡しは、制御部17と、文字
認識系16との間で行なわれる。
When confirming the input of the format determination signal by the operator (S5), the control unit 17 transfers the read control data based on the format determination signal (S6). This transfer is performed between the control unit 17 and the character recognition system 16.

【0048】ここでは読取り制御データメモリ14(2
6)には、文字パタンの切出しに関わる読取り制御デー
タと文字パタンの認識に関わる読取り制御データとを記
憶させてあり、制御部17は、フォーマット決定信号に
より決定された認識結果に対応する読取り制御データを
読出し済みの読取り制御データのなかから選択し、選択
した読取り制御データのうち文字パタンの切出しに関わ
る読取り制御データを文字切出し部32へ、また選択し
た読取り制御データのうち文字パタンの認識に関わる読
取り制御データを文字認識部38へ出力する。
Here, the read control data memory 14 (2
6) stores read control data related to character pattern extraction and read control data related to character pattern recognition, and the control unit 17 controls the read control corresponding to the recognition result determined by the format determination signal. Data is selected from the read control data that has already been read, read control data relating to character pattern cutting out of the selected read control data is sent to the character cutout unit 32, and character pattern is recognized among the selected read control data. The associated read control data is output to the character recognition unit 38.

【0049】次に制御部17は文字切出し部32及び文
字認識部38を起動する。すると文字切出し部32は、
帳票イメージデータから、1文字単位に、文字パタンを
切出し、切り出した文字パタンを文字パタンメモリ34
に格納する(S7)。文字認識部38は、切り出された
文字パタンを文字認識辞書36の辞書データと照合し
(S8)、この照合結果に基づいて文字パタンを認識
し、その認識結果を制御部17へ出力する(S9)。制
御部17は、1文字単位に、文字パタンの認識結果を入
力しそして帳票紙面40a上のすべての文字について認
識を終了したか否かを判定する(S10)。
Next, the control unit 17 activates the character cutout unit 32 and the character recognition unit 38. Then, the character extraction unit 32
A character pattern is cut out from the form image data in units of one character, and the cut out character pattern is stored in a character pattern memory 34.
(S7). The character recognition unit 38 checks the extracted character pattern against the dictionary data of the character recognition dictionary 36 (S8), recognizes the character pattern based on the comparison result, and outputs the recognition result to the control unit 17 (S9). ). The control unit 17 inputs a character pattern recognition result for each character, and determines whether or not recognition has been completed for all characters on the form paper surface 40a (S10).

【0050】帳票紙面40a上のすべての文字について
認識を終了していなければ、文字切出し部32及び文字
認識部38は、制御部17の動作制御に従ってS7〜S
9の処理を繰り返す。また帳票紙面40a上のすべての
文字について認識を終了したならば、帳票1枚分の文字
読取りを終了し、帳票1枚につき得た文字認識結果を後
段の装置へ出力する(終了)。
If the recognition of all the characters on the form paper 40a has not been completed, the character extracting section 32 and the character recognizing section 38 perform the operations of S7 to S7 in accordance with the operation control of the control section 17.
Step 9 is repeated. When the recognition is completed for all the characters on the form paper 40a, the reading of characters for one form is completed, and the character recognition result obtained for one form is output to the subsequent device (end).

【0051】(罫線パタンの抽出)次に罫線抽出部18
が行なう罫線パタンの抽出につき説明する。罫線抽出部
18は、帳票40全面にわたり帳票イメージデータを走
査し、帳票フォーマットを表す罫線パタンとして水平罫
線パタンと垂直罫線パタンとを抽出する。
(Extraction of Ruled Line Pattern) Next, the ruled line extracting unit 18
The extraction of the ruled line pattern performed by is described below. The ruled line extracting unit 18 scans the form image data over the entire form 40 and extracts a horizontal ruled line pattern and a vertical ruled line pattern as ruled line patterns representing a form format.

【0052】水平罫線パタンを抽出するときは、帳票イ
メージデータを水平走査し、水平走査線上で水平罫線閾
値TH(Lh)以上の長さLhだけ連続する帳票イメー
ジデータの線描画素を、水平罫線パタンの線描画素とし
て抽出する。連続する長さLhが水平罫線閾値TH(L
h)未満となる帳票イメージデータの線描画素(水平走
査線上で連続せずに孤立して存在する1個の線描画素を
含む)は、水平罫線パタンの背景画素として抽出する。
帳票イメージデータの背景画素もまた、水平罫線パタン
の背景画素として抽出する。水平罫線パタンはこのよう
にして帳票イメージデータから抽出した線描画素及び背
景画素から成るパタンである。
When extracting the horizontal ruled line pattern, the form image data is scanned horizontally, and the line drawing elements of the form image data that are continuous on the horizontal scanning line by a length Lh equal to or longer than the horizontal ruled line threshold TH (Lh) are extracted as horizontal ruled line patterns. Is extracted as a line drawing element of. The continuous length Lh is equal to the horizontal ruled line threshold TH (L
h) The line drawing elements (including one line drawing element which is not continuous on the horizontal scanning line and exists in isolation) of the form image data less than h) are extracted as the background pixels of the horizontal ruled line pattern.
Background pixels of the form image data are also extracted as background pixels of the horizontal ruled line pattern. The horizontal ruled line pattern is a pattern composed of line drawing elements and background pixels extracted from the form image data in this manner.

【0053】同様に垂直罫線パタンを抽出するときは、
帳票イメージデータを垂直走査し、垂直走査線上で垂直
罫線閾値TH(Lv)以上の長さLvだけ連続する帳票
イメージデータの線描画素を、垂直罫線パタンの線描画
素として抽出する。連続する長さLvが垂直罫線閾値T
H(Lv)未満となる帳票イメージデータの線描画素
(垂直走査線上で連続せずに孤立して存在する1個の線
描画素を含む)は、垂直罫線パタンの背景画素として抽
出する。帳票イメージデータの背景画素もまた、垂直罫
線パタンの背景画素として抽出する。垂直罫線パタンは
このようにして帳票イメージデータから抽出した線描画
素及び背景画素から成るパタンである。
Similarly, when extracting the vertical ruled line pattern,
The form image data is vertically scanned, and line drawing elements of the form image data that are continuous on the vertical scanning line by a length Lv equal to or longer than the vertical ruled line threshold TH (Lv) are extracted as line drawing elements of the vertical ruled line pattern. The continuous length Lv is equal to the vertical ruled line threshold T
Line drawing elements (including one line drawing element that is not continuous on a vertical scanning line and is isolated) of the form image data that is less than H (Lv) are extracted as background pixels of the vertical ruled line pattern. Background pixels of the form image data are also extracted as background pixels of the vertical ruled line pattern. The vertical ruled line pattern is a pattern composed of line drawing elements and background pixels extracted from the form image data in this manner.

【0054】抽出した水平罫線パタン及び垂直罫線パタ
ンに共通の格納領域(以下、罫線共通格納領域)を罫線
パタンメモリ20に設け、水平罫線パタン及び垂直罫線
パタンを重ね合わせて罫線共通格納領域に格納しても良
いし、抽出した水平罫線パタン及び垂直罫線パタンの各
パタン毎に個別の格納領域(以下、罫線個別格納領域)
を罫線パタンメモリ20に設け、水平罫線パタン及び垂
直罫線パタンをそれぞれ別々の罫線個別格納領域に格納
するようにしても良い。
A storage area common to the extracted horizontal ruled line pattern and vertical ruled line pattern (hereinafter, ruled line common storage area) is provided in the ruled line pattern memory 20, and the horizontal ruled line pattern and the vertical ruled line pattern are superimposed and stored in the ruled line common storage area. Alternatively, an individual storage area for each of the extracted horizontal ruled line pattern and vertical ruled line pattern (hereinafter referred to as a ruled line individual storage area)
May be provided in the ruled line pattern memory 20, and the horizontal ruled line pattern and the vertical ruled line pattern may be stored in separate ruled line individual storage areas.

【0055】罫線共通格納領域に格納する場合には、罫
線共通格納領域全面に背景画素を格納し(罫線共通格納
領域の初期化)、然る後、抽出した水平罫線パタンの線
描画素を共通格納領域に格納すると共に抽出した垂直罫
線パタンの線描画素を共通格納領域に格納する。
When the image data is stored in the ruled line common storage area, the background pixels are stored in the entire ruled line common storage area (initialization of the ruled line common storage area). The line drawing elements of the extracted vertical ruled line pattern are stored in the common storage area.

【0056】また罫線個別格納領域に格納する場合に
は、水平罫線パタンに対し設けた罫線個別格納領域全面
に背景画素を格納し(罫線個別格納領域の初期化)、然
る後、水平罫線パタンに対し設けた罫線個別格納領域
に、抽出した水平罫線パタンの線描画素を格納する。ま
た垂直罫線パタンに対し設けた罫線個別領域全面に背景
画素を格納し(罫線個別格納領域の初期化)、然る後、
垂直罫線パタンに対し設けた罫線個別格納領域に、抽出
した垂直罫線パタンの線描画素を格納する。
When storing in the ruled line individual storage area, background pixels are stored in the entire ruled line individual storage area provided for the horizontal ruled line pattern (initialization of the ruled line individual storage area), and thereafter, the horizontal ruled line pattern is stored. The line drawing elements of the extracted horizontal ruled line pattern are stored in the ruled line individual storage area provided for. In addition, background pixels are stored in the entire ruled line individual area provided for the vertical ruled line pattern (initialization of the ruled line individual storage area).
The extracted line drawing element of the vertical ruled line pattern is stored in a ruled line individual storage area provided for the vertical ruled line pattern.

【0057】図4はこの実施形態の罫線抽出部の動作の
説明に供する図であって、罫線パタンの線描画素を抽出
する動作に着目した動作の流れの具体的な一例を示す。
FIG. 4 is a diagram for explaining the operation of the ruled line extraction unit according to this embodiment, and shows a specific example of the operation flow focusing on the operation of extracting the line drawing element of the ruled line pattern.

【0058】まず、水平罫線パタンと垂直罫線パタンと
を重ね合わせて、罫線パタンメモリ20の罫線共通格納
領域に格納する場合について説明する。この場合、帳票
イメージメモリ54の帳票イメージデータ格納領域上と
罫線パタンメモリ20の罫線共通格納領域上とには、相
対応させたx−y座標系を設定してあり(例えば、水平
方向x軸方向及び垂直方向をy軸方向とする。)、この
座標系で表される画素位置の格納領域から画素データを
読み出し、或はまた、この座標系で表される画素位置の
格納領域へ画素データを書き込むことができるようにな
っているものとする。さらに帳票40の左辺がこれらx
−y座標系のy軸と、帳票40の上辺がこれらx−y座
標系のx軸と重なるように、帳票40をスキャナ52に
セットして、スキャナ52により帳票イメージデータを
得、従ってこれらx−y座標系のx、y軸上に帳票40
の上辺、左辺が載るように位置決めされた帳票イメージ
データ、罫線パタンを格納するものとする。
First, a case where the horizontal ruled line pattern and the vertical ruled line pattern are superimposed and stored in the ruled line common storage area of the ruled line pattern memory 20 will be described. In this case, a corresponding xy coordinate system is set on the form image data storage area of the form image memory 54 and the ruled line common storage area of the ruled line pattern memory 20 (for example, the horizontal x-axis). The direction and the vertical direction are defined as the y-axis direction.), The pixel data is read from the storage area of the pixel position represented by this coordinate system, or the pixel data is stored in the storage area of the pixel position represented by this coordinate system. Can be written. Furthermore, the left side of the form 40 is x
The form 40 is set on the scanner 52 such that the y axis of the y coordinate system and the upper side of the form 40 overlap the x axis of the xy coordinate system, and the form image data is obtained by the scanner 52. -Form 40 on the x and y axes of the y coordinate system
The form image data and the ruled line pattern positioned so that the upper side and the left side thereof are placed are stored.

【0059】制御部17により起動された罫線抽出部1
8は、罫線パタンメモリ20の罫線共通格納領域全面に
わたって背景画素ここでは白ビットを格納する(罫線共
通格納領域の初期化)。
The ruled line extraction unit 1 started by the control unit 17
Reference numeral 8 stores a background pixel, here a white bit, over the entire ruled line common storage area of the ruled line pattern memory 20 (initialization of the ruled line common storage area).

【0060】然る後、罫線抽出部18は走査方向を水平
方向として水平罫線パタンを抽出する処理を開始する
(開始)。この場合、閾値THとして水平罫線閾値TH
(Lh)を用い、また連続の長さLとして水平走査線上
で連続する線描画素の長さLhを求めることとなる。
Thereafter, the ruled line extracting unit 18 starts the process of extracting a horizontal ruled line pattern with the scanning direction being the horizontal direction (start). In this case, the horizontal ruled line threshold TH is used as the threshold TH.
(Lh) is used, and the length Lh of a continuous line drawing element on a horizontal scanning line is obtained as the continuous length L.

【0061】次に罫線抽出部18は、連続の長さLを零
に初期化し(S1)、然る後、帳票イメージメモリ54
に格納されている帳票イメージデータを水平走査し、帳
票イメージデータの画素データを読み出す(S2)。画
素データは1画素分のデータを表す。
Next, the ruled line extraction unit 18 initializes the continuous length L to zero (S1), and thereafter, the form image memory 54
Is scanned horizontally to read out pixel data of the form image data (S2). The pixel data represents data for one pixel.

【0062】次に罫線抽出部18は、読み出した帳票イ
メージデータの画素データが、線描画素ここでは黒ビッ
トであるか否かを判定する(S3)。
Next, the ruled line extracting unit 18 determines whether or not the pixel data of the read form image data is a line drawing element, here, a black bit (S3).

【0063】S3で画素データが線描画素であるとの判
定結果を得た場合は、連続の長さLを求めると共に水平
罫線パタンに関する線描画素の候補位置(以下、水平罫
線候補位置)として当該画素データの画素位置を記憶し
(S4)、然る後、帳票イメージデータにつき現走査線
1ラインの走査を終了したか否かを判定する(S5)。
ここでは、S3で画素データが線描画素であるとの判定
結果を得た場合に連続の長さLを1カウントアップする
ことによって従って連続する線描画素の個数を計数する
ことによって、連続の長さLを求める。
If it is determined in step S3 that the pixel data is a line drawing element, the continuous length L is determined, and the pixel drawing data is set as a line drawing element candidate position (hereinafter referred to as a horizontal ruled line candidate position) for the horizontal ruled line pattern. The pixel position of the data is stored (S4), and thereafter, it is determined whether or not scanning of the current scanning line for the form image data has been completed (S5).
Here, when the determination result that the pixel data is a line drawing element is obtained in S3, the continuous length L is counted up by one, and thus the number of continuous line drawing elements is counted. Find L.

【0064】S5で現走査線1ラインの走査を終了して
いないとの判定結果を得た場合は、現走査線上の次の画
素データを読み出すべくS2に戻る。
If it is determined in S5 that the scanning of one line of the current scanning line has not been completed, the process returns to S2 to read the next pixel data on the current scanning line.

【0065】S5の判定で現走査線1ラインの走査を終
了したとの判定結果を得た場合は、連続の長さLを閾値
THと比較する(S6)。ここでは水平罫線パタンを抽
出する場合であるので求めた連続の長さLは水平走査線
上における連続の長さLhであり、そして閾値THには
水平罫線閾値TH(Lh)を用いることとなる。
If it is determined in step S5 that the scanning of one line of the current scanning line has been completed, the continuous length L is compared with a threshold value TH (S6). Here, since the horizontal ruled line pattern is extracted, the determined continuous length L is the continuous length Lh on the horizontal scanning line, and the horizontal ruled line threshold TH (Lh) is used as the threshold TH.

【0066】S6で連続の長さLは閾値TH以上である
との判定結果を得た場合、罫線抽出部18は長さLの連
続する線描画素を、罫線パタンメモリ20に格納する
(S7)。ここでは記憶していた水平罫線候補位置の罫
線共通格納領域に線描画素を格納することとなる。S7
の次に、連続の長さLを初期化すると共に記憶していた
水平罫線候補位置を消去し(S8)、然る後、帳票40
全面にわたって帳票イメージデータの走査を終了したか
否かを判定する(S9)。またS6で連続の長さLは閾
値TH未満であるとの判定結果を得た場合は、S7を行
なわずに、S8〜S9を行なう。
If it is determined in S6 that the continuous length L is greater than or equal to the threshold value TH, the ruled line extraction unit 18 stores the continuous line drawing elements having the length L in the ruled line pattern memory 20 (S7). . Here, the line drawing element is stored in the stored ruled line common storage area at the horizontal ruled line candidate position. S7
Next, the continuous length L is initialized, and the stored horizontal ruled line candidate position is deleted (S8).
It is determined whether scanning of the form image data has been completed over the entire surface (S9). If it is determined in S6 that the continuous length L is less than the threshold value TH, S8 to S9 are performed without performing S7.

【0067】S9で帳票40全面にわたって帳票イメー
ジデータの走査を終了していないとの判定結果を得た場
合は、現走査線の次の走査線上に在る画素データを読み
出すべくS2に戻る。またS9で帳票全面にわたって帳
票イメージデータの走査を終了したとの判定結果を得た
場合は、当該帳票40から水平罫線パタンを抽出する処
理を終了する(終了)。
If it is determined in S9 that the scan of the form image data has not been completed over the entire form 40, the process returns to S2 to read out pixel data on the next scan line to the current scan line. If it is determined in S9 that the scanning of the form image data over the entire form has been completed, the process of extracting the horizontal ruled line pattern from the form 40 ends (end).

【0068】さらにS3の判定で読み出した画素データ
は線描画素でないとの判定結果を得た場合は、連続の長
さLを閾値THと比較する(S10)。
Further, when it is determined in step S3 that the pixel data read out is not a line drawing element, the continuous length L is compared with a threshold TH (S10).

【0069】S10で連続の長さLは閾値TH以上であ
るとの判定結果を得た場合、罫線抽出部18は長さLの
連続する線描画素を、罫線パタンメモリ20に格納する
(S11)。次に連続の長さLを零に初期化すると共に
記憶していた水平罫線候補位置を消去し(S12)、然
る後、現走査線一ラインの走査を終了したか否かを判定
する(S13)。現走査線一ラインの走査を終了してい
なければ(S13)、現走査線上の次の画素データを読
み出すべくS2に戻る。現走査線一ラインの走査を終了
したならば(S13)、S9を行なう。またS10で連
続の長さLは閾値TH未満であるとの判定結果を得た場
合は、S11を行なわずにS12〜S13を行なう。
If it is determined in S10 that the continuous length L is greater than or equal to the threshold value TH, the ruled line extraction unit 18 stores the continuous line drawing elements of the length L in the ruled line pattern memory 20 (S11). . Next, the continuous length L is initialized to zero, and the stored horizontal ruled line candidate position is erased (S12). Thereafter, it is determined whether or not scanning of one current scanning line has been completed (S12). S13). If the scanning of one line of the current scanning line has not been completed (S13), the process returns to S2 to read the next pixel data on the current scanning line. When the scanning of the current scanning line is completed (S13), S9 is performed. If it is determined in S10 that the continuous length L is less than the threshold value TH, S12 to S13 are performed without performing S11.

【0070】次に、罫線抽出部18は走査方向を垂直方
向として垂直罫線パタンを抽出する処理を開始する(開
始)。この場合、閾値THとして垂直罫線閾値TH(L
v)を用い、また連続の長さLとして垂直走査線上で連
続する線描画素の長さLvを求めることとなる。
Next, the ruled line extraction unit 18 starts processing for extracting a vertical ruled line pattern with the scanning direction being the vertical direction (start). In this case, as the threshold TH, the vertical ruled line threshold TH (L
v), and the length Lv of the line drawing elements that are continuous on the vertical scanning line is determined as the continuous length L.

【0071】次に罫線抽出部18は、連続の長さLを零
に初期化し(S1)、然る後、帳票イメージメモリ54
に格納されている帳票イメージデータを垂直走査し、帳
票イメージデータの画素データを読み出す(S2)。
Next, the ruled line extracting unit 18 initializes the length L of the continuation to zero (S1), and thereafter, the form image memory 54
Is vertically scanned, and pixel data of the form image data is read (S2).

【0072】次に罫線抽出部18は、読み出した帳票イ
メージデータの画素データが、線描画素ここでは黒ビッ
トであるか否かを判定する(S3)。
Next, the ruled line extracting section 18 determines whether or not the pixel data of the read form image data is a line drawing element, here, a black bit (S3).

【0073】S3で画素データが線描画素であるとの判
定結果を得た場合は、連続の長さLを求めると共に垂直
罫線パタンに関する線描画素の候補位置(以下、垂直罫
線候補位置)として当該画素データの画素位置を記憶し
(S4)、然る後、帳票イメージデータにつき現走査線
1ラインの走査を終了したか否かを判定する(S5)。
If it is determined in step S3 that the pixel data is a line drawing element, the continuous length L is obtained and the pixel drawing candidate position (hereinafter referred to as a vertical ruled line candidate position) for the vertical ruled line pattern is determined. The pixel position of the data is stored (S4), and thereafter, it is determined whether or not scanning of the current scanning line for the form image data has been completed (S5).

【0074】S5で現走査線1ラインの走査を終了して
いないとの判定結果を得た場合は、現走査線上の次の画
素データを読み出すべくS2に戻る。
If it is determined in S5 that the scanning of one line of the current scanning line has not been completed, the process returns to S2 to read out the next pixel data on the current scanning line.

【0075】S5の判定で現走査線1ラインの走査を終
了したとの判定結果を得た場合は、連続の長さLを閾値
THと比較する(S6)。ここでは垂直罫線パタンを抽
出する場合であるので求めた連続の長さLは垂直走査線
上における連続の長さLvであり、そして閾値THには
垂直罫線閾値TH(Lv)を用いることとなる。
If it is determined in S5 that the scanning of one current scanning line has been completed, the length L of the continuation is compared with a threshold value TH (S6). Here, since the vertical ruled line pattern is extracted, the determined continuous length L is the continuous length Lv on the vertical scanning line, and the vertical ruled line threshold TH (Lv) is used as the threshold TH.

【0076】S6で連続の長さLは閾値TH以上である
との判定結果を得た場合、罫線抽出部18は長さLの連
続する線描画素を、罫線パタンメモリ20に格納する
(S7)。ここでは記憶していた垂直罫線候補位置の罫
線共通格納領域に線描画素を格納することとなる。S7
の次に、連続の長さLを初期化すると共に記憶していた
垂直罫線候補位置を消去し(S8)、然る後、帳票40
全面にわたって帳票イメージデータの走査を終了したか
否かを判定する(S9)。またS6で連続の長さLは閾
値TH未満であるとの判定結果を得た場合は、S7を行
なわずに、S8〜S9を行なう。
If it is determined in S6 that the continuous length L is greater than or equal to the threshold value TH, the ruled line extraction unit 18 stores the continuous line drawing elements having the length L in the ruled line pattern memory 20 (S7). . Here, the line drawing element is stored in the stored ruled line common storage area at the vertical ruled line candidate position. S7
Next, the continuous length L is initialized, and the stored vertical ruled line candidate position is deleted (S8).
It is determined whether scanning of the form image data has been completed over the entire surface (S9). If it is determined in S6 that the continuous length L is less than the threshold value TH, S8 to S9 are performed without performing S7.

【0077】S9で帳票40全面にわたって帳票イメー
ジデータの走査を終了していないとの判定結果を得た場
合は、現走査線の次の走査線上に在る画素データを読み
出すべくS2に戻る。またS9で帳票全面にわたって帳
票イメージデータの走査を終了したとの判定結果を得た
場合は、当該帳票40から垂直罫線パタンを抽出する処
理を終了する(終了)。
If it is determined in S9 that the scanning of the form image data has not been completed over the entire form 40, the process returns to S2 in order to read the pixel data on the next scanning line after the current scanning line. If it is determined in step S9 that the scanning of the form image data has been completed over the entire form, the process of extracting the vertical ruled line pattern from the form 40 ends (end).

【0078】さらにS3の判定で読み出した画素データ
は線描画素でないとの判定結果を得た場合は、連続の長
さLを閾値THと比較する(S10)。
Further, if it is determined in step S3 that the pixel data read out is not a line drawing element, the continuous length L is compared with a threshold value TH (S10).

【0079】S10で連続の長さLは閾値TH以上であ
るとの判定結果を得た場合、罫線抽出部18は長さLの
連続する線描画素を、罫線パタンメモリ20に格納する
(S11)。次に連続の長さLを零に初期化すると共に
記憶していた垂直罫線候補位置を消去し(S12)、然
る後、現走査線一ラインの走査を終了したか否かを判定
する(S13)。現走査線一ラインの走査を終了してい
なければ(S13)、現走査線上の次の画素データを読
み出すべくS2に戻る。現走査線一ラインの走査を終了
したならば(S13)、S9を行なう。またS10で連
続の長さLは閾値TH未満であるとの判定結果を得た場
合は、S11を行なわずにS12〜S13を行なう。
When the determination result that the continuous length L is equal to or larger than the threshold value TH is obtained in S10, the ruled line extraction unit 18 stores the continuous line drawing elements of the length L in the ruled line pattern memory 20 (S11). . Next, the continuous length L is initialized to zero, and the stored vertical ruled line candidate position is erased (S12), and thereafter, it is determined whether or not scanning of one current scanning line has been completed (S12). S13). If the scanning of one line of the current scanning line has not been completed (S13), the process returns to S2 to read the next pixel data on the current scanning line. When the scanning of the current scanning line is completed (S13), S9 is performed. If it is determined in S10 that the continuous length L is less than the threshold value TH, S12 to S13 are performed without performing S11.

【0080】以上のようにして、図2(B)に示す帳票
40について水平及び垂直罫線パタンの線描画素を抽出
し、これらパタンの線描画素を重ね合わせて罫線共通格
納領域に格納した例を、図5に示す。図中、20aは罫
線パタンメモリ20の罫線共通格納領域、20bは罫線
共通格納領域20aにおいて帳票紙面40aに対応する
領域、44aは水平罫線パタン及び垂直罫線パタンの重
ね合わせパタンを示す。重ね合わせパタン44aは、水
平罫線パタンの線描画素と垂直罫線パタンの線描画素
と、水平罫線パタンの背景画素でありかつ垂直罫線パタ
ンの背景画素である画素とから成る。
As described above, an example in which the line drawing elements of the horizontal and vertical ruled line patterns are extracted from the form 40 shown in FIG. 2B, and the line drawing elements of these patterns are superimposed and stored in the ruled line common storage area is shown in FIG. As shown in FIG. In the figure, reference numeral 20a denotes a ruled line common storage area of the ruled line pattern memory 20, reference numeral 20b denotes an area corresponding to the form paper surface 40a in the ruled line common storage area 20a, and reference numeral 44a denotes an overlapping pattern of a horizontal ruled line pattern and a vertical ruled line pattern. The overlapping pattern 44a is composed of a line drawing element of a horizontal ruled line pattern, a line drawing element of a vertical ruled line pattern, and a pixel that is a background pixel of the horizontal ruled line pattern and a background pixel of the vertical ruled line pattern.

【0081】次に、水平罫線パタンと垂直罫線パタンと
を個別に、罫線パタンメモリ20の罫線個別格納領域に
格納する場合について説明する。この場合、帳票イメー
ジメモリ54の帳票イメージデータ格納領域上と罫線パ
タンメモリ20の各罫線個別格納領域上(水平罫線パタ
ンに対して設けた罫線個別格納領域上及び垂直罫線パタ
ンに対して設けた罫線個別格納領域上)とには、相対応
させたx−y座標系を設定してあり(例えば、水平方向
x軸方向及び垂直方向をy軸方向とする。)、この座標
系で表される画素位置の格納領域から画素データを読み
出し、或はまた、この座標系で表される画素位置の格納
領域へ画素データを書き込むことができるようになって
いるものとする。さらに帳票40の左辺がこれらx−y
座標系のy軸と、帳票40の上辺がこれらx−y座標系
のx軸と重なるように、帳票40をスキャナ52にセッ
トして、スキャナ52により帳票イメージデータを得、
従ってこれらx−y座標系のx、y軸上に帳票40の上
辺、左辺が載るように位置決めされた帳票イメージデー
タ、罫線パタンを格納するものとする。
Next, the case where the horizontal ruled line pattern and the vertical ruled line pattern are individually stored in the ruled line individual storage area of the ruled line pattern memory 20 will be described. In this case, the form image data storage area of the form image memory 54 and the individual ruled line storage area of the ruled line pattern memory 20 (the ruled line individual storage area provided for the horizontal ruled line pattern and the ruled line provided for the vertical ruled line pattern) (On the individual storage area), a corresponding xy coordinate system is set (for example, the horizontal x-axis direction and the vertical direction are defined as the y-axis direction), and represented by this coordinate system. It is assumed that the pixel data can be read from the storage area of the pixel position, or the pixel data can be written to the storage area of the pixel position represented by this coordinate system. Further, the left side of the form 40 is the xy
The form 40 is set on the scanner 52 such that the y-axis of the coordinate system and the upper side of the form 40 overlap the x-axis of the xy coordinate system, and form image data is obtained by the scanner 52.
Therefore, the form image data and the ruled line pattern positioned so that the top and left sides of the form 40 are placed on the x and y axes of the xy coordinate system are stored.

【0082】制御部17により起動された罫線抽出部1
8は、水平罫線パタンに対して設けた罫線個別格納領域
全面にわたって背景画素ここでは白ビットを格納する
(水平罫線パタンに対して設けた罫線個別格納領域の初
期化)。
The ruled line extraction unit 1 started by the control unit 17
Numeral 8 stores a background pixel, here a white bit, over the entire ruled line individual storage area provided for the horizontal ruled line pattern (initialization of the ruled line individual storage area provided for the horizontal ruled line pattern).

【0083】然る後、罫線抽出部18は走査方向を水平
方向として水平罫線パタンを抽出する処理を開始する
(開始)。この場合、閾値THとして水平罫線閾値TH
(Lh)を用い、また連続の長さLとして水平走査線上
で連続する線描画素の長さLhを求めることとなる。
Thereafter, the ruled line extraction unit 18 starts processing for extracting a horizontal ruled line pattern with the scanning direction being the horizontal direction (start). In this case, the horizontal ruled line threshold TH is used as the threshold TH.
(Lh) is used, and the length Lh of a continuous line drawing element on a horizontal scanning line is obtained as the continuous length L.

【0084】次に罫線抽出部18は、連続の長さLを零
に初期化し(S1)、然る後、帳票イメージメモリ54
に格納されている帳票イメージデータを水平走査し、帳
票イメージデータの画素データを読み出す(S2)。
Next, the ruled line extraction unit 18 initializes the length L of the continuation to zero (S1), and thereafter, the form image memory 54
Is scanned horizontally to read out pixel data of the form image data (S2).

【0085】次に罫線抽出部18は、読み出した帳票イ
メージデータの画素データが、線描画素ここでは黒ビッ
トであるか否かを判定する(S3)。
Next, the ruled line extracting unit 18 determines whether or not the pixel data of the read form image data is a line drawing element, here, a black bit (S3).

【0086】S3で画素データが線描画素であるとの判
定結果を得た場合は、連続の長さLを求めると共に水平
罫線候補位置として当該画素データの画素位置を記憶し
(S4)、然る後、帳票イメージデータにつき現走査線
1ラインの走査を終了したか否かを判定する(S5)。
When the result of the determination that the pixel data is a line drawing element is obtained in S3, the continuous length L is obtained and the pixel position of the pixel data is stored as a horizontal ruled line candidate position (S4). Thereafter, it is determined whether or not scanning of one current scanning line has been completed for the form image data (S5).

【0087】S5で現走査線1ラインの走査を終了して
いないとの判定結果を得た場合は、現走査線上の次の画
素データを読み出すべくS2に戻る。
If it is determined in S5 that the scanning of one line of the current scanning line has not been completed, the process returns to S2 to read the next pixel data on the current scanning line.

【0088】S5の判定で現走査線1ラインの走査を終
了したとの判定結果を得た場合は、連続の長さLを閾値
THと比較する(S6)。ここでは水平罫線パタンを抽
出する場合であるので求めた連続の長さLは水平走査線
上における連続の長さLhであり、そして閾値THには
水平罫線閾値TH(Lh)を用いることとなる。
If it is determined in step S5 that the scanning of one line of the current scanning line has been completed, the continuous length L is compared with a threshold TH (S6). Here, since the horizontal ruled line pattern is extracted, the determined continuous length L is the continuous length Lh on the horizontal scanning line, and the horizontal ruled line threshold TH (Lh) is used as the threshold TH.

【0089】S6で連続の長さLは閾値TH以上である
との判定結果を得た場合、罫線抽出部18は長さLの連
続する線描画素を、水平罫線パタンに対して設けた罫線
個別格納領域に格納する(S7)。ここでは記憶してい
た水平罫線候補位置の罫線個別格納領域に線描画素を格
納することとなる。S7の次に、連続の長さLを初期化
すると共に記憶していた水平罫線候補位置を消去し(S
8)、然る後、帳票40全面にわたって帳票イメージデ
ータの走査を終了したか否かを判定する(S9)。また
S6で連続の長さLは閾値TH未満であるとの判定結果
を得た場合は、S7を行なわずに、S8〜S9を行な
う。
When the determination result that the continuous length L is equal to or larger than the threshold value TH is obtained in S6, the ruled line extracting unit 18 determines a continuous line drawing element of the length L by using a ruled line pattern provided for the horizontal ruled line pattern. It is stored in the storage area (S7). Here, the line drawing element is stored in the stored ruled line individual storage area at the horizontal ruled line candidate position. After S7, the continuous length L is initialized, and the stored horizontal ruled line candidate position is deleted (S7).
8) Then, it is determined whether the scanning of the form image data over the entire form 40 has been completed (S9). If it is determined in S6 that the continuous length L is less than the threshold value TH, S8 to S9 are performed without performing S7.

【0090】S9で帳票40全面にわたって帳票イメー
ジデータの走査を終了していないとの判定結果を得た場
合は、現走査線の次の走査線上に在る画素データを読み
出すべくS2に戻る。またS9で帳票全面にわたって帳
票イメージデータの走査を終了したとの判定結果を得た
場合は、当該帳票40から水平罫線パタンを抽出する処
理を終了する(終了)。
If it is determined in S9 that the scanning of the form image data has not been completed over the entire form 40, the process returns to S2 in order to read out the pixel data on the next scanning line after the current scanning line. If it is determined in S9 that the scanning of the form image data over the entire form has been completed, the process of extracting the horizontal ruled line pattern from the form 40 ends (end).

【0091】さらにS3の判定で読み出した画素データ
は線描画素でないとの判定結果を得た場合は、連続の長
さLを閾値THと比較する(S10)。
Further, if it is determined in step S3 that the pixel data read out is not a line drawing element, the continuous length L is compared with a threshold value TH (S10).

【0092】S10で連続の長さLは閾値TH以上であ
るとの判定結果を得た場合、罫線抽出部18は長さLの
連続する線描画素を、罫線パタンメモリ20に格納する
(S11)。次に連続の長さLを零に初期化すると共に
記憶していた水平罫線候補位置を消去し(S12)、然
る後、現走査線一ラインの走査を終了したか否かを判定
する(S13)。現走査線一ラインの走査を終了してい
なければ(S13)、現走査線上の次の画素データを読
み出すべくS2に戻る。現走査線一ラインの走査を終了
したならば(S13)、S9を行なう。またS10で連
続の長さLは閾値TH未満であるとの判定結果を得た場
合は、S11を行なわずにS12〜S13を行なう。
If it is determined in S10 that the continuous length L is greater than or equal to the threshold value TH, the ruled line extraction unit 18 stores the continuous line drawing elements having the length L in the ruled line pattern memory 20 (S11). . Next, the continuous length L is initialized to zero, and the stored horizontal ruled line candidate position is erased (S12). Thereafter, it is determined whether or not scanning of one current scanning line has been completed (S12). S13). If the scanning of one line of the current scanning line has not been completed (S13), the process returns to S2 to read the next pixel data on the current scanning line. When the scanning of the current scanning line is completed (S13), S9 is performed. If it is determined in S10 that the continuous length L is less than the threshold value TH, S12 to S13 are performed without performing S11.

【0093】次に罫線抽出部18は、垂直罫線パタンに
対して設けた罫線個別格納領域全面にわたって背景画素
ここでは白ビットを格納する(垂直罫線パタンに対して
設けた罫線個別格納領域の初期化)。
Next, the ruled line extraction unit 18 stores the background pixel, ie, the white bit, over the entire ruled line individual storage area provided for the vertical ruled line pattern (initialization of the ruled line individual storage region provided for the vertical ruled line pattern). ).

【0094】然る後、罫線抽出部18は走査方向を垂直
方向として垂直罫線パタンを抽出する処理を開始する
(開始)。この場合、閾値THとして垂直罫線閾値TH
(Lv)を用い、また連続の長さLとして垂直走査線上
で連続する線描画素の長さLvを求めることとなる。
Thereafter, the ruled line extraction unit 18 starts processing for extracting a vertical ruled line pattern with the scanning direction being the vertical direction (start). In this case, the vertical ruled line threshold TH is used as the threshold TH.
(Lv) is used, and the length Lv of the continuous line drawing element on the vertical scanning line is determined as the continuous length L.

【0095】次に罫線抽出部18は、連続の長さLを零
に初期化し(S1)、然る後、帳票イメージメモリ54
に格納されている帳票イメージデータを垂直走査し、帳
票イメージデータの画素データを読み出す(S2)。
Next, the ruled line extraction unit 18 initializes the length L of the continuation to zero (S1), and thereafter, the form image memory 54
Is vertically scanned, and pixel data of the form image data is read (S2).

【0096】次に罫線抽出部18は、読み出した帳票イ
メージデータの画素データが、線描画素ここでは黒ビッ
トであるか否かを判定する(S3)。
Next, the ruled line extraction unit 18 determines whether or not the pixel data of the read form image data is a line drawing element, here, a black bit (S3).

【0097】S3で画素データが線描画素であるとの判
定結果を得た場合は、連続の長さLを求めると共に垂直
罫線候補位置として当該画素データの画素位置を記憶し
(S4)、然る後、帳票イメージデータにつき現走査線
1ラインの走査を終了したか否かを判定する(S5)。
If the result of the determination in S3 is that the pixel data is a line drawing element, the continuous length L is obtained, and the pixel position of the pixel data is stored as a vertical ruled line candidate position (S4). Thereafter, it is determined whether or not scanning of one current scanning line has been completed for the form image data (S5).

【0098】S5で現走査線1ラインの走査を終了して
いないとの判定結果を得た場合は、現走査線上の次の画
素データを読み出すべくS2に戻る。
If it is determined in S5 that the scanning of one line of the current scanning line has not been completed, the process returns to S2 to read the next pixel data on the current scanning line.

【0099】S5の判定で現走査線1ラインの走査を終
了したとの判定結果を得た場合は、連続の長さLを閾値
THと比較する(S6)。ここでは垂直罫線パタンを抽
出する場合であるので求めた連続の長さLは垂直走査線
上における連続の長さLvであり、そして閾値THには
垂直罫線閾値TH(Lv)を用いることとなる。
If it is determined in step S5 that the scanning of one line of the current scanning line has been completed, the continuous length L is compared with the threshold TH (S6). Here, since the vertical ruled line pattern is extracted, the determined continuous length L is the continuous length Lv on the vertical scanning line, and the vertical ruled line threshold TH (Lv) is used as the threshold TH.

【0100】S6で連続の長さLは閾値TH以上である
との判定結果を得た場合、罫線抽出部18は長さLの連
続する線描画素を、垂直罫線パタンに対して設けた罫線
個別格納領域に格納する(S7)。ここでは記憶してい
た垂直罫線候補位置の罫線個別格納領域に線描画素を格
納することとなる。S7の次に、連続の長さLを初期化
すると共に記憶していた垂直罫線候補位置を消去し(S
8)、然る後、帳票40全面にわたって帳票イメージデ
ータの走査を終了したか否かを判定する(S9)。また
S6で連続の長さLは閾値TH未満であるとの判定結果
を得た場合は、S7を行なわずに、S8〜S9を行な
う。
When the determination result that the continuous length L is equal to or larger than the threshold value TH is obtained in S6, the ruled line extracting unit 18 determines the continuous line drawing element of the length L by using a ruled line pattern provided for the vertical ruled line pattern. It is stored in the storage area (S7). Here, the line drawing element is stored in the stored ruled line individual storage area at the vertical ruled line candidate position. Subsequent to S7, the continuous length L is initialized, and the stored vertical ruled line candidate positions are deleted (S7).
8) Then, it is determined whether the scanning of the form image data over the entire form 40 has been completed (S9). If it is determined in S6 that the continuous length L is less than the threshold value TH, S8 to S9 are performed without performing S7.

【0101】S9で帳票40全面にわたって帳票イメー
ジデータの走査を終了していないとの判定結果を得た場
合は、現走査線の次の走査線上に在る画素データを読み
出すべくS2に戻る。またS9で帳票全面にわたって帳
票イメージデータの走査を終了したとの判定結果を得た
場合は、当該帳票40から垂直罫線パタンを抽出する処
理を終了する(終了)。
If it is determined in S9 that the scanning of the form image data has not been completed over the entire form 40, the process returns to S2 in order to read the pixel data on the next scanning line after the current scanning line. If it is determined in step S9 that the scanning of the form image data has been completed over the entire form, the process of extracting the vertical ruled line pattern from the form 40 ends (end).

【0102】さらにS3の判定で読み出した画素データ
は線描画素でないとの判定結果を得た場合は、連続の長
さLを閾値THと比較する(S10)。
Further, if it is determined in S3 that the pixel data read out is not a line drawing element, the length L of the continuation is compared with a threshold value TH (S10).

【0103】S10で連続の長さLは閾値TH以上であ
るとの判定結果を得た場合、罫線抽出部18は長さLの
連続する線描画素を、罫線パタンメモリ20に格納する
(S11)。次に連続の長さLを零に初期化すると共に
記憶していた垂直罫線候補位置を消去し(S12)、然
る後、現走査線一ラインの走査を終了したか否かを判定
する(S13)。現走査線一ラインの走査を終了してい
なければ(S13)、現走査線上の次の画素データを読
み出すべくS2に戻る。現走査線一ラインの走査を終了
したならば(S13)、S9を行なう。またS10で連
続の長さLは閾値TH未満であるとの判定結果を得た場
合は、S11を行なわずにS12〜S13を行なう。
If it is determined in S10 that the continuous length L is greater than or equal to the threshold value TH, the ruled line extraction unit 18 stores the continuous line drawing elements having the length L in the ruled line pattern memory 20 (S11). . Next, the continuous length L is initialized to zero, and the stored vertical ruled line candidate position is erased (S12), and thereafter, it is determined whether or not scanning of one current scanning line has been completed (S12). S13). If the scanning of one line of the current scanning line has not been completed (S13), the process returns to S2 to read the next pixel data on the current scanning line. When the scanning of the current scanning line is completed (S13), S9 is performed. If it is determined in S10 that the continuous length L is less than the threshold value TH, S12 to S13 are performed without performing S11.

【0104】以上のようにして、図2(B)に示す帳票
40について水平及び垂直罫線パタンの線描画素を抽出
し、これらパタンの線描画素をそれぞれ別々の罫線個別
格納領域に格納した例を、図6に示す。図6(A)中、
20cは水平罫線パタンに対して設けた罫線個別格納領
域、20dは罫線個別格納領域20cにおいて帳票紙面
40aに対応する領域、及び44bは水平罫線パタンを
示す。また図6(B)中、20eは垂直罫線パタンに対
して設けた罫線個別格納領域、20fは罫線個別格納領
域20eにおいて帳票紙面40aに対応する領域、及び
44cは垂直罫線パタンを示す。
As described above, the line drawing elements of the horizontal and vertical ruled line patterns are extracted from the form 40 shown in FIG. 2B, and the line drawing elements of these patterns are stored in separate ruled line individual storage areas. As shown in FIG. In FIG. 6A,
Reference numeral 20c denotes a ruled line individual storage area provided for the horizontal ruled line pattern, 20d denotes an area corresponding to the form paper surface 40a in the ruled line individual storage area 20c, and 44b denotes a horizontal ruled line pattern. In FIG. 6B, reference numeral 20e denotes a ruled line individual storage area provided for the vertical ruled line pattern, 20f denotes an area corresponding to the form paper surface 40a in the ruled line individual storage area 20e, and 44c denotes a vertical ruled line pattern.

【0105】(帳票フォーマットの認識)次にフォーマ
ット認識部24が行なう帳票フォーマットの認識につい
て説明する。ここではフォーマット認識辞書22は、帳
票イメージデータから予め抽出しておいた帳票標準フォ
ーマットの特徴を、辞書データとして保持し、フォーマ
ット認識部24は、抽出された罫線パタンを走査して罫
線パタンにより表される帳票フォーマットの特徴を抽出
し、該抽出特徴を帳票標準フォーマットの特徴と比較し
て認識の確からしさを求めることにより、照合を行な
う。認識の確からしさとして例えば距離や確信度を用い
ることができる。
(Recognition of Form Format) Next, the recognition of the form format performed by the format recognition unit 24 will be described. Here, the format recognition dictionary 22 holds the features of the form standard format previously extracted from the form image data as dictionary data, and the format recognition unit 24 scans the extracted ruled line patterns and displays them in the form of ruled line patterns. The feature of the form to be extracted is extracted, and the extracted feature is compared with the feature of the form standard format to obtain the certainty of the recognition, thereby performing the collation. For example, distance or certainty can be used as the certainty of the recognition.

【0106】辞書データの作成に当っては、帳票標準フ
ォーマット(標準的な帳票フォーマット)を有する帳票
を複数用意し、各帳票毎に、帳票イメージデータから罫
線抽出部18の場合と同様にして罫線パタンを抽出し、
抽出した罫線パタンを走査して特徴を抽出する。この抽
出特徴は、帳票標準フォーマットを有する帳票イメージ
データから抽出したものであるので、帳票標準フォーマ
ットの特徴となる。この帳票標準フォーマットの特徴を
辞書データとしてフォーマット認識辞書22に記憶させ
る。帳票標準フォーマットの特徴と帳票標準フォーマッ
トの種別とを、帳票標準フォーマットの各種別毎に個別
に、相対応づけて記憶させる。
In creating dictionary data, a plurality of forms having a form standard format (standard form format) are prepared, and for each form, the ruled line is extracted from the form image data in the same manner as the ruled line extracting unit 18. Extract the pattern,
The extracted ruled line pattern is scanned to extract features. Since the extracted features are extracted from the form image data having the form standard format, they are features of the form standard format. The features of the standard form are stored in the format recognition dictionary 22 as dictionary data. The characteristic of the form standard format and the type of the form standard format are stored in association with each other for each type of the form standard format.

【0107】帳票フォーマットの認識に当っては、帳票
フォーマット未知の帳票イメージデータを走査して、罫
線抽出部18により罫線パタンを抽出する。そして抽出
した罫線パタンを走査して特徴を抽出し、この抽出特徴
を、帳票標準フォーマットの各種別毎に、帳票標準フォ
ーマットの特徴と照合する。例えば、帳票フォーマット
未知の帳票から抽出した罫線パタンの特徴と帳票標準フ
ォーマットの特徴との間の距離を認識の確からしさに用
いて照合を行なう。そしてフォーマット認識辞書22に
記憶させた帳票標準フォーマットの種別のなかから、各
種別毎に求めた認識の確からしさに基づいて、一又は複
数の種別を選択し、選択した種別を帳票フォーマットの
認識結果として出力する。例えば、帳票標準フォーマッ
トの種別を、認識の確からしさの高いものから低いもの
の順に並べ、n=1、2、……として第n番目の認識の
確からしさと第n+1番目の認識の確からしさとの差を
調べ、当該差が閾値以上となったときの第1番から第n
番目までの認識の確からしさに対応する帳票標準フォー
マットの種別を、認識結果として選択する。
In recognizing the form format, form image data of an unknown form format is scanned, and a ruled line pattern is extracted by the ruled line extracting unit 18. Then, the extracted ruled line pattern is scanned to extract features, and the extracted features are collated with the features of the form standard format for each type of the form standard format. For example, the matching is performed using the distance between the feature of the ruled line pattern extracted from the form of unknown form format and the feature of the form standard format as the certainty of recognition. Then, one or more types are selected from the types of the form standard formats stored in the format recognition dictionary 22 based on the certainty of the recognition obtained for each type, and the selected type is used as the recognition result of the form format. Output as For example, the types of the form standard formats are arranged in the order from the one with the highest probability of recognition to the one with the lowest probability of recognition, and n = 1, 2,..., And the probability of the nth recognition and the probability of the (n + 1) th recognition are determined. Investigate the difference, and when the difference is greater than or equal to the threshold,
The type of the form standard format corresponding to the certainty of the recognition up to the recognition is selected as the recognition result.

【0108】或はまたフォーマット認識辞書22は、帳
票イメージデータから予め抽出しておいた帳票標準フォ
ーマットを表す罫線標準パタンを、辞書データとして保
持し、フォーマット認識部24は、抽出された罫線パタ
ンを罫線標準パタンと比較して認識の確からしさを求め
ることにより、照合を行なうようにしても良い。認識の
確からしさとしては例えば一致の程度や確信度を用いる
ことができる。
Alternatively, the format recognition dictionary 22 holds, as dictionary data, ruled line standard patterns representing a form standard format previously extracted from the form image data, and the format recognition section 24 stores the extracted ruled line patterns. The matching may be performed by determining the likelihood of recognition by comparing with a ruled line standard pattern. As the certainty of the recognition, for example, the degree of coincidence or the certainty can be used.

【0109】この場合の辞書データ作成に当っては、帳
票標準フォーマットを有する帳票を複数用意し、各帳票
毎に、帳票イメージデータから罫線抽出部18の場合と
同様にして罫線パタンを抽出する。この罫線パタンは帳
票標準フォーマットを有する帳票のイメージデータから
抽出したものであるので、罫線標準パタンとなるもので
ある。この罫線標準パタンを、辞書データとしてフォー
マット認識辞書22に記憶させる。罫線標準パタンと帳
票標準フォーマットの種別とを、帳票標準フォーマット
の各種別毎に個別に、相対応づけて記憶させる。
In preparing dictionary data in this case, a plurality of forms having a form standard format are prepared, and for each form, a ruled line pattern is extracted from the form image data in the same manner as the ruled line extracting unit 18. Since this ruled line pattern is extracted from image data of a form having a form standard format, it is a ruled line standard pattern. The ruled line standard pattern is stored in the format recognition dictionary 22 as dictionary data. The ruled line standard pattern and the type of the form standard format are stored in association with each other for each type of the form standard format.

【0110】帳票フォーマットの認識に当っては、帳票
フォーマット未知の帳票イメージデータを走査して、罫
線抽出部18により罫線パタンを抽出する。そして抽出
した罫線パタンを、帳票標準フォーマットの各種別毎
に、罫線標準パタンと照合する。例えば、帳票フォーマ
ット未知の帳票から抽出した罫線パタンと、罫線標準パ
タンとの間の一致の程度を認識の確からしさに用いて照
合を行なう。そしてフォーマット認識辞書22に記憶さ
せた帳票標準フォーマットの種別のなかから、各種別毎
に求めた認識の確からしさに基づいて、一又は複数の種
別を選択し、選択した種別を帳票フォーマットの認識結
果として出力する。例えば、帳票標準フォーマットの種
別を、認識の確からしさの高いものから低いものの順に
並べ、n=1、2、……として第n番目の認識の確から
しさと第n+1番目の認識の確からしさとの差を調べ、
当該差が閾値以上となったときの第1番から第n番目ま
での認識の確からしさに対応する帳票標準フォーマット
の種別を、認識結果として選択する。
In recognizing the form format, the form image data whose form is unknown is scanned, and a ruled line pattern is extracted by the ruled line extracting unit 18. Then, the extracted ruled line pattern is collated with the ruled line standard pattern for each type of the form standard format. For example, the matching is performed using the degree of matching between a ruled line pattern extracted from a form of unknown form format and a ruled line standard pattern as the certainty of recognition. Then, one or more types are selected from the types of the form standard formats stored in the format recognition dictionary 22 based on the certainty of the recognition obtained for each type, and the selected type is used as the recognition result of the form format. Output as For example, the types of the form standard formats are arranged in the order from the one with the highest probability of recognition to the one with the lowest probability of recognition, and n = 1, 2,..., And the probability of the nth recognition and the probability of the (n + 1) th recognition are determined. Examine the difference,
The type of the form standard format corresponding to the likelihood of the first to n-th recognition when the difference is equal to or larger than the threshold is selected as the recognition result.

【0111】(参照データの表示)次に表示部28が行
なう表示につき説明する。図7は表示部の表示の説明に
供する図であって、帳票フォーマットの認識結果が得ら
れた後に、オペレータが認識結果を確認決定する作業を
助けるため、表示部28が行なう表示の一例を示す。
(Display of Reference Data) Next, the display performed by the display unit 28 will be described. FIG. 7 is a diagram for explaining the display on the display unit, and shows an example of display performed by the display unit 28 to assist the operator in confirming and determining the recognition result after the recognition result of the form format is obtained. .

【0112】図7の例において、表示部28は、帳票イ
メージデータメモリ54から制御部17により読み出さ
れた帳票フォーマット未知の帳票イメージデータ52と
当該イメージデータ52の認識結果に対応する参照デー
タ54とを、並列させて、表示部28の同一表示画面2
8aに同時に表示している。従ってオペレータは、帳票
フォーマットの帳票イメージデータ52と当該イメージ
データ52に対応する参照データ54とを比較すること
ができるので、最も確からしい認識結果を判断決定する
作業を、正確に行なうことができる。
In the example of FIG. 7, the display unit 28 displays the form image data 52 of unknown form format read by the control unit 17 from the form image data memory 54 and the reference data 54 corresponding to the recognition result of the image data 52. And the same display screen 2 of the display unit 28
8a are simultaneously displayed. Therefore, since the operator can compare the form image data 52 in the form format with the reference data 54 corresponding to the image data 52, the operator can accurately perform the operation of judging and determining the most likely recognition result.

【0113】入力デバイス30としてはポインティング
デバイス例えばマウス若しくはトラックボールや、キー
ボードを用い、オペレータはこのような入力デバイス3
0を操作することにより、最も確からしいと判断決定し
た認識結果を指示する信号を制御部17へ入力する。
As the input device 30, a pointing device such as a mouse or a trackball or a keyboard is used.
By operating 0, a signal indicating a recognition result determined to be most probable is input to the control unit 17.

【0114】さらに図7の例において、表示部28は、
帳票フォーマットの複数の認識結果に対応する参照デー
タ54を、認識の確からしさの高い順に表示する。この
場合、制御部17は、帳票フォーマットの認識結果と当
該認識結果の認識の確からしさとをフォーマット認識部
28から入力し、認識の確からしさに基づいて認識の確
からしさの高い順に認識結果をソートし、その順番に対
応させて参照データ54を表示部28に表示させる。オ
ペレータは、認識の確からしさの高い順に表示された参
照データを順番に見て、帳票イメージデータ52と比較
することができるので、最も確からしい認識結果を判断
決定する作業を、正確にしかも迅速に行なえる。
Further, in the example of FIG. 7, the display unit 28
The reference data 54 corresponding to a plurality of recognition results in the form format are displayed in the order of high recognition probability. In this case, the control unit 17 inputs the recognition result of the form format and the probability of recognition of the recognition result from the format recognition unit 28, and sorts the recognition results in descending order of the probability of recognition based on the probability of recognition. Then, the reference data 54 is displayed on the display unit 28 in accordance with the order. The operator can look at the reference data displayed in the order of the probability of recognition in order and compare it with the form image data 52. Therefore, the operator can accurately and quickly determine and determine the most likely recognition result. I can do it.

【0115】さらに図7の例において、表示部28は、
参照データ54として読取り制御データを表示する。従
って参照データメモリ26として、読取り制御データメ
モリ14を用いるものであって、図1に示すフォーマッ
ト認識装置52(この装置52は請求項1のフォーマッ
ト認識装置の実施形態となるものである)は、フォーマ
ット認識系12と表示部28と入力デバイス30と参照
データメモリ26(14)とフォーマット認識系12及
び表示部28の制御を行なう制御部17とを備える。
尚、読取り制御データを、帳票フォーマットの各種別毎
に個別に用意し、読取り制御データと帳票フォーマット
の種別とを、帳票フォーマットの各種別毎に個別に、相
対応づけて読取り制御データメモリ14に記憶させる。
Further, in the example of FIG. 7, the display unit 28
The read control data is displayed as the reference data 54. Therefore, the read control data memory 14 is used as the reference data memory 26, and the format recognition device 52 shown in FIG. 1 (this device 52 is an embodiment of the format recognition device of claim 1) It includes a format recognition system 12, a display unit 28, an input device 30, a reference data memory 26 (14), and a control unit 17 for controlling the format recognition system 12 and the display unit 28.
The read control data is prepared separately for each type of form format, and the read control data and the type of form format are individually associated with each type of form format in the read control data memory 14 in association with each other. Remember.

【0116】表示部28に表示させる参照データとし
て、例えば、文字パタンの切出しに関わる読取り制御デ
ータ(以下、第一の参照データとも言う)を用いる。文
字パタンの切出しに関わる読取り制御データは、例え
ば、帳票幅、帳票高さ、帳票内の行数、帳票内の行位
置、帳票内のフィールド数、帳票内のフィールド位置、
前記行内若しくはフィールド内の文字数、及び、前記行
内若しくはフィールド内の文字ピッチであって、これら
文字パタンの切出しに関わる読取り制御データを、図
形、記号、文字、色、輝度若しくはこれらの組み合わせ
により区別して表して、表示する。
As the reference data to be displayed on the display unit 28, for example, read control data (hereinafter, also referred to as first reference data) relating to extraction of a character pattern is used. The read control data related to the extraction of the character pattern includes, for example, form width, form height, number of lines in the form, line position in the form, number of fields in the form, field position in the form,
The number of characters in the line or the field, and the character pitch in the line or the field, and the read control data related to the cutout of these character patterns are distinguished by graphics, symbols, characters, colors, brightness, or combinations thereof. Express and display.

【0117】図示例では、帳票の輪郭線を表す枠で、帳
票1枚分の参照データを囲むと共に、その枠の幅及び高
さにより帳票幅及び帳票高さを表している。また行、フ
ィールド、文字を表す矩形で、行の位置及び個数とフィ
ールドの位置及び個数と、行及びフィールド内の文字数
とを表し、さらに文字を表す矩形の配設ピッチにより、
文字ピッチを表している。この他、1行分の領域、フィ
ールド1個分の領域、文字1個分の領域を、点線、一転
鎖線等の線種の異なる線で囲んで表したり、色を異なら
せて表したり、輝度を異ならせて表したりしても良い。
或は、1行分の領域、フィールド1個分の領域、文字1
個分の領域を、輪郭形状が異なる枠で囲んで表しても良
い(例えば行を矩形で、フィールドを横に細長い長楕円
で、文字を三角で表す)。或は、文字の個数及びピッチ
を、文字で表して表示するようにしても良い。例えば文
字の個数5個とか、文字のピッチ10mmというように
表す。
In the illustrated example, a frame representing the outline of the form surrounds the reference data for one form, and the width and height of the form indicate the form width and form height. Lines, fields, rectangles representing characters, the position and number of lines, the position and number of fields, and the number of characters in lines and fields, and furthermore, by the arrangement pitch of the rectangle representing characters,
Represents the character pitch. In addition, an area corresponding to one line, an area corresponding to one field, and an area corresponding to one character are represented by being surrounded by a line having a different line type such as a dotted line, a one-dot chain line, represented by different colors, or represented by luminance. May be represented differently.
Or, one line area, one field area, character 1
The individual area may be represented by being surrounded by a frame having a different outline shape (for example, a line is rectangular, a field is a long and thin ellipse, and a character is a triangle). Alternatively, the number and pitch of characters may be represented by characters and displayed. For example, the number of characters is represented as 5 or the pitch of the characters is 10 mm.

【0118】さらに表示部28に表示させる参照データ
として、前記第一の参照データと、これに加え文字パタ
ンの認識に用いる読取り制御データ(以下、第二の参照
データとも言う)とを用いても良い。第二の参照データ
は、例えば帳票内に記載される文字の字種若しくは字体
であって、これら第一及び第二の参照データを、図形、
記号、文字、色、輝度若しくはこれらの組み合わせによ
り区別して表して表示し、第二の参照データを、第一の
参照データの表示位置の近傍位置若しくは第一の参照デ
ータの表示位置と重なる位置に表示する。例えば、字種
及び字体を、記号、文字、図形により表し、字種及び字
体が異なる各領域毎に、字種及び字体を表す記号等を表
示すれば良い。例えば、帳票内の行及びフィールドを、
矩形枠等の図形で表して表示し、帳票内の行及びフィー
ルドに記載される文字の字種、字体を、色で表し、行及
びフィールドを表す図形が囲む領域の色を、対応する字
種、字体を表す色にして表示を行なうようにする。或
は、行及びフィールドに記載される文字の字種、字体
を、色で表し、行及びフィールドを表す図形の外形線
を、対応する字種、字体を表す色の線にして表示するよ
うにしても良い。或は、行及びフィールドに記載される
文字の字種、字体を、線種で表し、行及びフィールドを
表す図形の外形線を、対応する字種、字体を表す線種の
線にして表示するようにしても良い。或はまた、帳票内
の行及びフィールドを矩形枠等の図形で表して表示し、
帳票内の行及びフィールドに記載される文字の字種、字
体の名称を、文字で表して表示し、行及びフィールドを
表す図形の、上側、下側、左側或は右側の近傍位置に、
字種、字体の名称を表す文字を表示するようにしても良
い。
Further, as the reference data to be displayed on the display section 28, the first reference data and the read control data (hereinafter also referred to as second reference data) used for character pattern recognition may be used. good. The second reference data is, for example, a character type or a font of a character described in a form, and the first and second reference data are represented by a graphic,
Symbols, characters, colors, brightness or a combination thereof are displayed and displayed separately, and the second reference data is placed at a position near the display position of the first reference data or at a position overlapping with the display position of the first reference data. indicate. For example, the character type and the font may be represented by a symbol, a character, and a graphic, and a symbol representing the character type and the font may be displayed for each area having a different character type and font. For example, lines and fields in a form
It is represented by a figure such as a rectangular frame and displayed, and the character type and font of the characters described in the lines and fields in the form are represented by colors, and the color of the area surrounded by the lines and fields is represented by the corresponding character type. , And display in a color representing the font. Alternatively, the character types and fonts of the characters described in the lines and fields are represented by colors, and the outlines of the figures representing the lines and fields are displayed as lines of the corresponding character types and fonts. May be. Alternatively, the character type and font of the characters described in the lines and fields are represented by line types, and the outlines of the figures representing the lines and fields are displayed as lines of the corresponding character types and font types. You may do it. Alternatively, the lines and fields in the form are represented by a graphic such as a rectangular frame and displayed.
The character type of the characters described in the lines and fields in the form and the name of the font are displayed in characters and displayed, and in the upper, lower, left or right neighboring positions of the figures representing the lines and fields,
Characters representing character types and font names may be displayed.

【0119】さらにフォーマット認識部24が帳票フォ
ーマットの認識結果を得るのに用いた認識の確からしさ
を表す数値を、参照データ54と対応づけて、参照デー
タ54と同一の表示画面28aに表示するようにしても
良い。このように帳票フォーマットの認識結果の認識の
確からしさを表す数値と当該認識結果の参照データ54
とを相対応づけて同一の表示画面28aに同時に表示す
ることにより、オペレータが最も確からしい認識結果を
判断決定する作業を、行ない易くすることができる。
Further, the numerical value representing the certainty of the recognition used by the format recognition unit 24 to obtain the recognition result of the form format is associated with the reference data 54 and displayed on the same display screen 28a as the reference data 54. You may do it. As described above, the numerical value representing the certainty of the recognition of the recognition result in the form format and the reference data 54 of the recognition result.
Are displayed simultaneously on the same display screen 28a in association with each other, so that the operator can easily perform the operation of judging and determining the most likely recognition result.

【0120】さらに図示例では、帳票イメージデータ5
2に含まれる行領域、フィールド領域、1文字分の記載
領域或は文字の拡大・縮小率と、参照データ54に含ま
れる行領域、フィールド領域若しくは1文字分の記載領
域を表す図形若しくは参照データ54に含まれる文字の
拡大・縮小率とを異ならせこれらデータ52、54を表
示しているが、これらの拡大・縮小率を等しくしこれら
を並列させて表示するようにしても良い。これらの拡大
・縮小率を等しくして表示することにより、オペレータ
が最も確からしい認識結果を判断決定する作業を、行な
い易くすることができる。
In the illustrated example, the form image data 5
2, a line area, a field area, a description area for one character or a character enlargement / reduction rate, and a figure or reference data representing a line area, a field area, or a description area for one character included in the reference data 54. Although these data 52 and 54 are displayed with different enlargement / reduction ratios of the characters included in 54, the enlargement / reduction ratios may be equalized and displayed in parallel. By displaying these enlargement / reduction rates at the same value, the operator can easily perform the operation of determining and determining the most likely recognition result.

【0121】さらに、帳票イメージデータ52に含まれ
る行領域、フィールド領域、1文字分の記載領域若しく
は文字の拡大・縮小率と、参照データ54に含まれる行
領域、フィールド領域、1文字分の記載領域を表す図形
若しくは参照データ54に含まれる文字の拡大・縮小率
とを等しくし、これら拡大・縮小率の等しいデータ5
2、54を重ね合わせて表示するようにしても良い。例
えば、帳票イメージデータ52を得た帳票の左辺、上辺
と、参照データ54が表す帳票の左辺、上辺とが重なり
合うように位置決めして、これらデータ52、54を表
示する。このように重ね合わせて表示することにより、
オペレータが最も確か確からしい認識結果を判断決定す
る作業を、行ない易くすることができる。
Further, a line area, a field area included in the form image data 52, a description area for one character or a character enlargement / reduction ratio, and a line area, a field area included in the reference data 54, and a description for one character are included. The enlargement / reduction ratio of the figure or character included in the reference data 54 representing the area is made equal, and the data 5 having the same enlargement / reduction ratio is set.
2, 54 may be superimposed and displayed. For example, the left side and the top side of the form from which the form image data 52 is obtained and the left side and the top side of the form represented by the reference data 54 are positioned so as to overlap, and these data 52 and 54 are displayed. By superimposing and displaying in this way,
This makes it easier for the operator to judge and determine the most likely recognition result.

【0122】(文字パタンの認識)次に文字認識部38
が行なう文字パタンの認識について説明する。ここでは
文字認識辞書36は、文字標準パタンの特徴を辞書デー
タとして保持し、文字認識部38は、切り出された文字
パタンを走査して切り出された文字パタンの特徴を抽出
し、該抽出特徴を文字標準パタンの特徴と比較して認識
の確からしさを求めることにより、照合を行なう。認識
の確からしさとして例えば距離や確信度を用いることが
できる。
(Character Pattern Recognition) Next, the character recognition unit 38
The character pattern recognition performed by the user will be described. Here, the character recognition dictionary 36 holds the characteristics of the character standard pattern as dictionary data, and the character recognition unit 38 scans the extracted character pattern to extract the characteristics of the extracted character pattern, and extracts the extracted characteristics. The matching is performed by determining the certainty of the recognition by comparing with the features of the character standard pattern. For example, distance or certainty can be used as the certainty of the recognition.

【0123】辞書データの作成に当っては、標準文字を
光学的に走査して得た文字標準パタンを複数用意し、各
標準文字パタン毎に、文字標準パタンを走査して文字標
準パタンの特徴を抽出する。そして抽出した文字標準パ
タンの特徴を、辞書データとして文字認識辞書36に記
憶させる。文字標準パタンの特徴と文字名とを、各文字
標準パタン毎に個別に、相対応づけて記憶させる。
In preparing the dictionary data, a plurality of character standard patterns obtained by optically scanning standard characters are prepared, and the character standard patterns are scanned for each standard character pattern. Is extracted. Then, the feature of the extracted character standard pattern is stored in the character recognition dictionary 36 as dictionary data. The feature of the character standard pattern and the character name are stored individually and in association with each other for each character standard pattern.

【0124】文字パタンの認識に当っては、文字読取り
を行なうべき帳票イメージデータから、文字パタンを切
出し、切り出した文字パタンを走査して切出し文字パタ
ンの特徴を抽出する。この抽出特徴を、各文字標準パタ
ン毎に、文字標準パタンの特徴と照合する。例えば、切
出した文字パタンの特徴と文字標準パタンの特徴との間
の距離を認識の確からしさに用いて照合を行なう。そし
て文字認識辞書36に記憶させた文字名のなかから、各
文字標準パタン毎に求めた認識の確からしさに基づい
て、一又は複数の文字名を選択し、選択した文字名を文
字パタンの認識結果として出力する。
In recognizing the character pattern, a character pattern is cut out from the form image data to be read, and the cut character pattern is scanned to extract the characteristics of the cut character pattern. This extracted feature is collated with the feature of the character standard pattern for each character standard pattern. For example, the matching is performed using the distance between the feature of the extracted character pattern and the feature of the character standard pattern as the certainty of recognition. Then, one or a plurality of character names are selected from the character names stored in the character recognition dictionary 36 based on the certainty of the recognition obtained for each character standard pattern, and the selected character names are recognized as character patterns. Output as result.

【0125】或はまた文字認識辞書36は、文字標準パ
タンを辞書データとして保持し、文字認識部38は、切
り出された文字パタンを文字標準パタンと比較して認識
の確からしさを求めることにより、照合を行なうように
しても良い。
Alternatively, the character recognition dictionary 36 holds the character standard pattern as dictionary data, and the character recognizing unit 38 compares the cut-out character pattern with the character standard pattern to obtain the certainty of the recognition. You may make it collate.

【0126】この場合の辞書データ作成に当っては、標
準文字を光学的に走査して文字標準パタンを得、文字標
準パタンを辞書データとして文字認識辞書36に記憶さ
せる。複数の文字標準パタンを用意し、文字標準パタン
と文字名とを、各文字標準パタン毎に個別に、相対応づ
けて記憶させる。
In creating dictionary data in this case, standard characters are optically scanned to obtain a character standard pattern, and the character standard pattern is stored in the character recognition dictionary 36 as dictionary data. A plurality of character standard patterns are prepared, and the character standard patterns and the character names are stored individually and in association with each other for each character standard pattern.

【0127】文字パタンの認識に当っては、文字読取り
を行なうべき帳票イメージデータから文字パタンを切り
出し、そして切り出した文字パタンを、各文字標準パタ
ン毎に、文字標準パタンと照合する。例えば、切り出し
た文字パタンと、文字標準パタンとの間の一致の程度を
認識の確からしさに用いて照合を行なう。そして文字認
識辞書36に記憶させた文字名のなかから、各文字標準
パタン毎に求めた認識の確からしさに基づいて、一又は
複数の文字名を選択し、選択した文字名を文字パタンの
認識結果として出力する。
In recognizing a character pattern, a character pattern is cut out from form image data to be read, and the cut out character pattern is collated with the character standard pattern for each character standard pattern. For example, the matching is performed using the degree of matching between the extracted character pattern and the character standard pattern as the certainty of recognition. Then, one or a plurality of character names are selected from the character names stored in the character recognition dictionary 36 based on the certainty of the recognition obtained for each character standard pattern, and the selected character names are recognized as character patterns. Output as result.

【0128】この実施形態によれば、帳票フォーマット
の種別を表す識別番号が記載されていない帳票であって
も(図2(B)の帳票参照)、帳票フォーマットの種別
に対応した読取り制御データを利用して、文字パタンの
切出し及び認識が行なえる。読取り制御データを利用す
ることにより、文字パタンの切出し及び認識のための処
理を高速に行なえる。また読取り制御データを利用する
ことにより、文字パタンの切出し及び認識のための処理
を簡単化できるので、装置のハードウエア規模或はソフ
トウエア規模を小さくすることができる。
According to this embodiment, even if a form is not described with an identification number indicating the type of the form format (see the form in FIG. 2B), the read control data corresponding to the type of the form format is transmitted. Utilizing it, a character pattern can be cut out and recognized. By using the read control data, processing for extracting and recognizing a character pattern can be performed at high speed. Also, by using the read control data, the processing for extracting and recognizing a character pattern can be simplified, so that the hardware scale or software scale of the apparatus can be reduced.

【0129】また帳票フォーマット未知の帳票イメージ
データ52と当該データ52の認識結果に対応する参照
データ54とを、同一の表示画面28aに同時に表示す
るようにしたので、オペレータは、最も確からしい認識
結果を判断決定する作業を、正確に行なえる。
Since the form image data 52 whose form format is unknown and the reference data 54 corresponding to the recognition result of the data 52 are displayed on the same display screen 28a at the same time, the operator can obtain the most reliable recognition result. Work can be performed accurately.

【0130】図8は文字読取り装置の構成を概略的に示
す機能ブロック図である。同図に示す文字読取り装置
は、請求項9の文字読取り装置の実施形態となるもので
あって、請求項1のフォーマット認識装置の実施形態を
含んでいる。以下の説明では、請求項9の文字読取り装
置の実施形態の説明と共に、請求項1のフォーマット認
識装置の実施形態につき説明する。以下、図1の実施形
態と相違する点につき説明し、図1の実施形態と同様の
点についてはその詳細な説明を省略する。
FIG. 8 is a functional block diagram schematically showing the configuration of the character reading device. The character reading device shown in the figure is an embodiment of the character reading device of claim 9 and includes an embodiment of the format recognition device of claim 1. In the following description, an embodiment of the format recognition apparatus of claim 1 will be described together with an embodiment of the character reading apparatus of claim 9. Hereinafter, points different from the embodiment of FIG. 1 will be described, and detailed description of the same points as the embodiment of FIG. 1 will be omitted.

【0131】この実施形態では、参照データメモリ26
としてフォーマット画像メモリ56を設け、読取り制御
データメモリ14を参照データメモリ26としては用い
ない。従ってフォーマット認識装置52は、フォーマッ
ト認識系12、表示部28、入力デバイス30及び制御
部17と、フォーマット画像メモリ56(26)とから
成る。
In this embodiment, the reference data memory 26
The read control data memory 14 is not used as the reference data memory 26. Therefore, the format recognition device 52 includes the format recognition system 12, the display unit 28, the input device 30, the control unit 17, and the format image memory 56 (26).

【0132】フォーマット画像メモリ56は、参照デー
タとして、帳票標準フォーマットの辞書データを得るの
に用いた帳票のイメージデータ(参照用イメージデー
タ)、或は、読取り制御データを得るのに用いた帳票の
イメージデータ(参照用イメージデータ)を保持するも
のであって、このような参照データと帳票フォーマット
の種別とを、帳票フォーマットの各種別毎に個別に、相
対応づけて、フォーマット画像メモリ56に記憶させて
いる。
The format image memory 56 stores, as reference data, image data of a form used for obtaining dictionary data in a form standard format (reference image data) or a form used for obtaining read control data. The image data (reference image data) is held, and the reference data and the form format are individually stored in the format image memory 56 in association with each of the form formats. Let me.

【0133】図9は表示部の表示の説明に供する図であ
って、帳票フォーマットの認識結果が得られた後に、オ
ペレータが認識結果を確認決定する作業を助けるために
表示部28が行なう表示の一例を示す。同図にも示すよ
うに、参照データ54として、読取り制御データに代え
て、帳票標準フォーマットの辞書データ或は読取り制御
データを得るのに用いた帳票のイメージデータを表示す
る。
FIG. 9 is a diagram for explaining the display on the display unit. After the recognition result of the form format is obtained, the display unit 28 displays the display to assist the operator in confirming and determining the recognition result. An example is shown. As shown in the figure, instead of the read control data, image data of a form used for obtaining dictionary data in a form standard format or read control data is displayed as the reference data 54.

【0134】制御部17は、フォーマット認識部24か
ら帳票フォーマットの認識結果を入力すると、入力した
認識結果に対応した参照用イメージデータを、フォーマ
ット画像メモリ56(26)から読み出して表示部28
に表示させる。
When the control unit 17 receives the form format recognition result from the format recognition unit 24, the control unit 17 reads out the reference image data corresponding to the input recognition result from the format image memory 56 (26), and reads the display image data.
To be displayed.

【0135】次にこの実施形態の全体的な動作の流れに
ついて図3を参照して説明する。S1〜S3は図1の実
施形態の場合と同様である。
Next, the overall operation flow of this embodiment will be described with reference to FIG. S1 to S3 are the same as those in the embodiment of FIG.

【0136】次に制御部17は、入力した帳票フォーマ
ットの認識結果に対応した既知の帳票フォーマットの帳
票イメージデータを参照データとして参照データメモリ
26(56)から読み出し、読み出した参照データを表
示部28に表示させると共に、当該認識結果を得た帳票
フォーマット未知の帳票イメージデータを帳票イメージ
メモリ54から読み出し表示部28に表示させ(S
4)、然る後、オペレータによるフォーマット決定信号
の入力を待つ(S5)。
Next, the control section 17 reads form image data of a known form format corresponding to the input form format recognition result from the reference data memory 26 (56) as reference data, and displays the read reference data on the display section 28. And the form image data of the unknown form format obtained from the recognition result is read out from the form image memory 54 and displayed on the display unit 28 (S
4) After that, it waits for the input of the format determination signal by the operator (S5).

【0137】オペレータは、参照データと帳票フォーマ
ット未知の帳票イメージデータとを比較参照し、最も確
からしい認識結果を判断決定し、入力デバイス30を操
作して、その判断結果に対応したフォーマット決定信号
を入力する。
The operator compares and refers to the reference data and the form image data whose form format is unknown, determines and determines the most probable recognition result, and operates the input device 30 to generate a format determination signal corresponding to the determined result. input.

【0138】制御部17は、オペレータによるフォーマ
ット決定信号の入力を確認すると(S5)、フォーマッ
ト決定信号に基づいて、読取り制御データの受け渡しを
行なう(S6)。この受け渡しは、制御部17と、読取
り制御データメモリ14及び文字認識系16との間で行
なわれる。
When the control unit 17 confirms the input of the format determination signal by the operator (S5), it transfers the read control data based on the format determination signal (S6). This transfer is performed between the control unit 17, the read control data memory 14, and the character recognition system 16.

【0139】ここでは読取り制御データメモリ14に
は、文字パタンの切出しに関わる読取り制御データと文
字パタンの認識に関わる読取り制御データとを記憶させ
てあり、制御部17は、フォーマット決定信号により決
定された認識結果に対応する読取り制御データを読取り
制御データメモリ14から読み出し、そして文字パタン
の切出しに関わる読取り制御データを文字切出し部32
へ、また文字パタンの認識に関わる読取り制御データを
文字認識部38へ出力する。S6以降のS7〜S10は
図1の実施形態と同様である。
Here, the read control data memory 14 stores read control data relating to character pattern extraction and read control data relating to character pattern recognition, and the control unit 17 is determined by a format determination signal. The read control data corresponding to the recognized result is read out from the read control data memory 14, and the read control data relating to the character pattern cutout is read out by the character cutout unit 32.
And read control data relating to the recognition of the character pattern to the character recognition unit 38. S7 to S10 after S6 are the same as those in the embodiment of FIG.

【0140】この実施形態でも、帳票フォーマットの種
別を表す識別番号が記載されていない帳票であっても
(図2(B)の帳票参照)、帳票フォーマットの種別に
対応した読取り制御データを利用して、文字パタンの切
出し及び認識が行なえる。読取り制御データを利用する
ことにより、文字パタンの切出し及び認識のための処理
を高速に行なえる。また読取り制御データを利用するこ
とにより、文字パタンの切出し及び認識のための処理を
簡単化できるので、装置のハードウエア規模或はソフト
ウエア規模を小さくすることができる。
Even in this embodiment, even if the form does not have the identification number indicating the form format (see the form in FIG. 2B), the read control data corresponding to the form format is used. Thus, character patterns can be cut out and recognized. By using the read control data, processing for extracting and recognizing a character pattern can be performed at high speed. Also, by using the read control data, the processing for extracting and recognizing a character pattern can be simplified, so that the hardware scale or software scale of the apparatus can be reduced.

【0141】また帳票フォーマット未知の帳票イメージ
データ52と当該データ52の認識結果に対応する参照
データ54とを、同一の表示画面28aに同時に表示す
るようにしたので、オペレータは、最も確からしい認識
結果を判断決定する作業を、正確に行なえる。
Further, since the form image data 52 whose form format is unknown and the reference data 54 corresponding to the recognition result of the data 52 are simultaneously displayed on the same display screen 28a, the operator can obtain the most reliable recognition result. Work can be performed accurately.

【0142】図10は文字読取り装置の構成を概略的に
示す機能ブロック図である。同図に示す文字読取り装置
は、請求項9の文字読取り装置の実施形態となるもので
あって、請求項1のフォーマット認識装置の実施形態を
含んでいる。以下の説明では、請求項9の文字読取り装
置の実施形態の説明と共に、請求項1のフォーマット認
識装置の実施形態につき説明する。以下、図1の実施形
態と相違する点につき説明し、図1の実施形態と同様の
点についてはその詳細な説明を省略する。
FIG. 10 is a functional block diagram schematically showing the configuration of the character reading device. The character reading device shown in the figure is an embodiment of the character reading device of claim 9 and includes an embodiment of the format recognition device of claim 1. In the following description, an embodiment of the format recognition apparatus of claim 1 will be described together with an embodiment of the character reading apparatus of claim 9. Hereinafter, points different from the embodiment of FIG. 1 will be described, and detailed description of the same points as the embodiment of FIG. 1 will be omitted.

【0143】この実施形態では、参照データメモリ26
としてフォーマット画像メモリ56を設け、読取り制御
データメモリ14とフォーマット画像メモリ56とを双
方ともに参照データメモリ26として用いる。従ってフ
ォーマット認識装置52は、フォーマット認識系12、
表示部28、入力デバイス30及び制御部17と、読取
り制御データメモリ14(26)及びフォーマット画像
メモリ56(26)とから成る。
In this embodiment, the reference data memory 26
The read image data memory 14 and the format image memory 56 are both used as the reference data memory 26. Therefore, the format recognition device 52 includes the format recognition system 12,
It comprises a display unit 28, an input device 30 and a control unit 17, a read control data memory 14 (26) and a format image memory 56 (26).

【0144】フォーマット画像メモリ56は、参照デー
タとして、帳票標準フォーマットの辞書データを得るの
に用いた帳票のイメージデータ、或は、読取り制御デー
タを得るのに用いた帳票のイメージデータを保持するも
のであって、このような参照データと帳票フォーマット
の種別とを、帳票フォーマットの各種別毎に個別に、相
対応づけて、フォーマット画像メモリ56に記憶させて
いる。
The format image memory 56 holds, as reference data, image data of a form used for obtaining dictionary data in a form standard format or image data of a form used for obtaining read control data. The reference data and the form format are stored in the format image memory 56 in association with each other for each form format.

【0145】表示部28は、参照データ54として、読
取り制御データに加え、帳票標準フォーマットの辞書デ
ータ或は読取り制御データを得るのに用いた帳票のイメ
ージデータ(参照用イメージデータ)を表示するもので
あって、参照データ54として表示する参照用イメージ
データに含まれる行領域、フィールド領域、1文字分の
記載領域若しくは文字の拡大・縮小率と、参照データ5
4として表示する読取り制御データに含まれる行領域、
フィールド領域、1文字分の記載領域を表す図形若しく
は参照データ54として表示する読取り制御データに含
まれる文字の拡大・縮小率とを等しくして、これら参照
データ54としての参照用イメージデータ及び読取り制
御データを重ね合わせて表示する。例えば、参照データ
として表示する参照用イメージデータ52を得た帳票の
左辺、上辺と、参照データ54として表示する読取り制
御データが表す帳票の左辺、上辺とが重なり合うように
位置決めして、これら参照用イメージデータ及び読取り
制御データを表示する。このように重ね合わせて表示す
ることにより、オペレータが最も確か確からしい認識結
果を判断決定する作業を、行ない易くすることができ
る。尚、参照データ54としての参照用イメージデータ
に、文字パタンの切出しに関わる読取り制御データを参
照データとして重ね合わせて表示したり、参照データ5
4としての参照用イメージデータに、文字パタンの切出
し及び認識に関わる読取り制御データを参照データとし
て重ね合わせて表示したりすることができる。
The display unit 28 displays, as reference data 54, image data (reference image data) of a form used to obtain dictionary data in the form standard format or read control data in addition to the read control data. The line area, the field area, the description area for one character or the character enlargement / reduction ratio included in the reference image data displayed as the reference data 54, and the reference data 5
A line area included in the read control data displayed as 4;
A field area, a figure representing a description area for one character, or the enlargement / reduction ratio of characters included in the read control data displayed as the reference data 54 are equalized, and the reference image data and the read control as these reference data 54 are set. Display the data superimposed. For example, positioning is performed such that the left side and the upper side of the form from which the reference image data 52 to be displayed as the reference data are obtained and the left side and the upper side of the form represented by the read control data displayed as the reference data 54 overlap. Display image data and read control data. By superimposing and displaying in this way, it is possible to make it easier for the operator to judge and determine the most reliable recognition result. It should be noted that reading control data relating to the extraction of a character pattern is superimposed and displayed as reference data on the reference image data as the reference data 54, or the reference data 5.
It is possible to superimpose read control data relating to character pattern extraction and recognition as reference data on the reference image data as No. 4, and display it.

【0146】制御部17は、フォーマット認識部24か
ら帳票フォーマットの認識結果を入力すると、入力した
認識結果に対応した参照用イメージデータを、フォーマ
ット画像メモリ56(26)から読み出して表示部28
に表示させると共に入力した認識結果に対応した読取り
制御データを、読取り制御データメモリ14(26)か
ら読み出して表示部28に表示させる。
When the control unit 17 inputs the recognition result of the form format from the format recognition unit 24, the control unit 17 reads out the reference image data corresponding to the input recognition result from the format image memory 56 (26), and reads out the display image data.
The read control data corresponding to the input recognition result is read out from the read control data memory 14 (26) and displayed on the display unit 28.

【0147】次にこの実施形態の全体的な動作の流れに
ついて図3を参照して説明する。S1〜S3は図1の実
施形態の場合と同様である。
Next, the overall operation flow of this embodiment will be described with reference to FIG. S1 to S3 are the same as those in the embodiment of FIG.

【0148】次に制御部17は、入力した帳票フォーマ
ットの認識結果に対応した参照用イメージデータを参照
データとして参照データメモリ26(56)から読み出
しさらに入力した帳票フォーマットの認識結果に対応し
た読取り制御データを参照データとして参照データメモ
リ26(14)から読み出して、これら読み出した参照
データを重ね合わせて表示部28に表示させ、これと共
に、当該認識結果を得た帳票フォーマット未知の帳票イ
メージデータを帳票イメージデータから読み出して参照
データとは別の位置に並列させて表示部28に表示させ
る(S4)。S4以降のS5〜S10は図1の実施形態
と同様である。
Next, the control unit 17 reads out the reference image data corresponding to the input form format recognition result from the reference data memory 26 (56) as reference data, and further reads the read image format corresponding to the input form format recognition result. The data is read from the reference data memory 26 (14) as reference data, and the read reference data is superimposed and displayed on the display unit 28. At the same time, the form image data of an unknown form format obtained from the recognition result is recorded on the form. It is read from the image data and displayed on the display unit 28 in parallel with a position different from the reference data (S4). Steps S5 to S10 after S4 are the same as those in the embodiment of FIG.

【0149】この実施形態でも、帳票フォーマットの種
別を表す識別番号が記載されていない帳票であっても
(図2(B)の帳票参照)、帳票フォーマットの種別に
対応した読取り制御データを利用して、文字パタンの切
出し及び認識が行なえる。読取り制御データを利用する
ことにより、文字パタンの切出し及び認識のための処理
を高速に行なえる。また読取り制御データを利用するこ
とにより、文字パタンの切出し及び認識のための処理を
簡単化できるので、装置のハードウエア規模或はソフト
ウエア規模を小さくすることができる。
Even in this embodiment, even if a form does not have an identification number indicating the form format type (see the form in FIG. 2B), read control data corresponding to the form format type is used. Thus, character patterns can be cut out and recognized. By using the read control data, processing for extracting and recognizing a character pattern can be performed at high speed. Also, by using the read control data, the processing for extracting and recognizing a character pattern can be simplified, so that the hardware scale or software scale of the apparatus can be reduced.

【0150】また帳票フォーマット未知の帳票イメージ
データ52と当該データ52の認識結果に対応する参照
データ54とを、同一の表示画面28aに同時に表示す
るようにしたので、オペレータは、最も確からしい認識
結果を判断決定する作業を、正確に行なえる。
Further, since the form image data 52 whose form format is unknown and the reference data 54 corresponding to the recognition result of the data 52 are displayed simultaneously on the same display screen 28a, the operator can recognize the most probable recognition result. Work can be performed accurately.

【0151】次に図1の実施形態の変形例について説明
する。図11はこの変形例の文字読取り装置の全体的な
動作の流れを示す図である。この変形例は、動作が異な
るほかは、図1の実施形態と同様の構成であるので、適
宜図1を参照されたい。
Next, a modification of the embodiment shown in FIG. 1 will be described. FIG. 11 is a diagram showing the flow of the overall operation of the character reading device of this modification. This modified example has the same configuration as the embodiment of FIG. 1 except for the operation, and therefore, please refer to FIG. 1 as appropriate.

【0152】まずスキャナ52により帳票イメージデー
タを得る。スキャナ52は帳票40の紙面40aを光学
的に走査して、量子化された電気信号例えば白黒2値の
電気信号から成る帳票イメージデータを生成し、このデ
ータを帳票イメージメモリ54に格納する。ここでは線
描画素を黒ビットで、背景画素を白ビットで表す。尚、
線描画素は紙面40a内に在る線を表す画素、背景画素
は紙面40aの地の部分(線の背景となる部分)を表す
画素である。
First, form image data is obtained by the scanner 52. The scanner 52 optically scans the paper surface 40a of the form 40, generates form image data composed of quantized electric signals, for example, black and white binary electric signals, and stores the data in the form image memory 54. Here, a line drawing element is represented by a black bit, and a background pixel is represented by a white bit. still,
The line drawing element is a pixel representing a line in the paper surface 40a, and the background pixel is a pixel representing a ground portion (a portion serving as a line background) of the paper surface 40a.

【0153】帳票イメージメモリ54に帳票イメージデ
ータが格納されると、制御部17は罫線抽出部18を起
動する(開始)。
When the form image data is stored in the form image memory 54, the control unit 17 activates the ruled line extraction unit 18 (start).

【0154】起動された罫線抽出部18は、帳票イメー
ジメモリ54に格納されている帳票イメージデータを走
査して、罫線パタンを抽出し、抽出した罫線パタンを罫
線パタンメモリ20に格納する(S1)。
The activated ruled line extracting unit 18 scans the form image data stored in the form image memory 54, extracts ruled line patterns, and stores the extracted ruled line patterns in the ruled line pattern memory 20 (S1). .

【0155】罫線抽出部18が罫線パタンの抽出を終了
すると、制御部17はフォーマット認識部24を起動す
る。
When the ruled line extraction unit 18 finishes extracting the ruled line pattern, the control unit 17 activates the format recognition unit 24.

【0156】起動されたフォーマット認識部24は、罫
線パタンメモリ20に格納されている罫線パタンを、フ
ォーマット認識辞書22に格納されている帳票フォーマ
ットの辞書データと照合し(S2)、この照合結果に基
づいて、罫線パタンにより表される帳票フォーマットを
認識し、この認識結果を制御部17へ出力する(S
3)。
The activated format recognition unit 24 compares the ruled line pattern stored in the ruled line pattern memory 20 with the form data dictionary data stored in the format recognition dictionary 22 (S2). Based on this, the form format represented by the ruled line pattern is recognized, and this recognition result is output to the control unit 17 (S
3).

【0157】制御部17は、入力した帳票フォーマット
の認識結果に対応した読取り制御データを既知の帳票フ
ォーマットの参照データとして参照データメモリ26
(14)から読み出し(S4)、然る後、制御部17
は、入力した帳票フォーマットの認識結果が1つであっ
たか否かを判定する(S5)。
The control unit 17 converts the read control data corresponding to the input form format recognition result into reference data memory 26 as reference data of a known form format.
Reading from (14) (S4), after that, the control unit 17
Determines whether or not the recognition result of the input form format is one (S5).

【0158】S5で入力した帳票フォーマットの認識結
果は複数であるとの判定結果を得た場合は、制御部17
は、参照データとして読み出した読取り制御データを表
示部28に表示させると共に、当該認識結果を得た帳票
フォーマット未知の帳票イメージデータを帳票イメージ
メモリ54から読み出して表示部28に表示させ(S
6)、然る後、オペレータによるフォーマット決定信号
の入力を待つ(S7)。
In the case where the result of the form format recognition input in S5 is determined to be plural, the control unit 17
Displays the read control data read as the reference data on the display unit 28, reads the form image data of the unknown form format obtained from the recognition result from the form image memory 54, and displays the read form image data on the display unit 28 (S
6) After that, it waits for the input of the format determination signal by the operator (S7).

【0159】オペレータは、参照データと帳票フォーマ
ット未知の帳票イメージデータとを比較参照し、最も確
からしい認識結果を判断決定し、入力デバイス30を操
作して、その判断結果に対応したフォーマット決定信号
を入力する。
The operator compares and refers to the reference data and the form image data of an unknown form format, determines and determines the most probable recognition result, and operates the input device 30 to generate a format determination signal corresponding to the determined result. input.

【0160】制御部17は、オペレータによるフォーマ
ット決定信号の入力を確認すると(S7)、フォーマッ
ト決定信号に基づいて、読取り制御データの受け渡しを
行なう(S8)。この受け渡しは、制御部17と、文字
認識系16との間で行なわれる。
When the control unit 17 confirms the input of the format determination signal by the operator (S7), it transfers the read control data based on the format determination signal (S8). This transfer is performed between the control unit 17 and the character recognition system 16.

【0161】ここでは読取り制御データメモリ14(2
6)には、文字パタンの切出しに関わる読取り制御デー
タと文字パタンの認識に関わる読取り制御データとを記
憶させてあり、制御部17は、フォーマット決定信号に
より決定された認識結果に対応する読取り制御データを
読出し済みの読取り制御データのなかから選択し、選択
した読取り制御データのうち文字パタンの切出しに関わ
る読取り制御データを文字切出し部32へ、また選択し
た読取り制御データのうち文字パタンの認識に関わる読
取り制御データを文字認識部38へ出力する。
Here, the read control data memory 14 (2
6) stores read control data related to character pattern extraction and read control data related to character pattern recognition, and the control unit 17 controls the read control corresponding to the recognition result determined by the format determination signal. Data is selected from the read control data that has already been read, read control data relating to character pattern cutting out of the selected read control data is sent to the character cutout unit 32, and character pattern is recognized among the selected read control data. The associated read control data is output to the character recognition unit 38.

【0162】次に制御部17は文字切出し部32及び文
字認識部38を起動する。すると文字切出し部32は、
帳票イメージデータから、1文字単位に、文字パタンを
切出し、切り出した文字パタンを文字パタンメモリ34
に格納する(S9)。文字認識部38は、切り出された
文字パタンを文字認識辞書36の辞書データと照合し
(S10)、この照合結果に基づいて文字パタンを認識
し、その認識結果を制御部17へ出力する(S11)。
制御部17は、1文字単位に、文字パタンの認識結果を
入力しそして帳票紙面40a上のすべての文字について
認識を終了したか否かを判定する(S12)。
Next, the control unit 17 activates the character extracting unit 32 and the character recognizing unit 38. Then, the character extraction unit 32
A character pattern is cut out from the form image data in units of one character, and the cut out character pattern is stored in a character pattern memory 34.
(S9). The character recognition unit 38 checks the extracted character pattern against the dictionary data of the character recognition dictionary 36 (S10), recognizes the character pattern based on the comparison result, and outputs the recognition result to the control unit 17 (S11). ).
The control unit 17 inputs a character pattern recognition result for each character, and determines whether or not recognition has been completed for all characters on the form paper surface 40a (S12).

【0163】帳票紙面40a上のすべての文字について
認識を終了していなければ、文字切出し部32及び文字
認識部38は、制御部17の動作制御に従ってS9〜S
12の処理を繰り返す。また帳票紙面40a上のすべて
の文字について認識を終了したならば、帳票1枚分の文
字読取りを終了し、帳票1枚につき得た文字認識結果を
後段の装置へ出力する(終了)。
If the recognition of all the characters on the form paper 40a has not been completed, the character extracting unit 32 and the character recognizing unit 38 execute S9 to S9 in accordance with the operation control of the control unit 17.
Step 12 is repeated. When the recognition is completed for all the characters on the form paper 40a, the reading of characters for one form is completed, and the character recognition result obtained for one form is output to the subsequent device (end).

【0164】またS5の判定で入力した帳票フォーマッ
トの認識結果は1つであるとの判定結果を得た場合に
は、制御部17は当該認識結果に対応する読取り制御デ
ータを既に読出し済みの読取り制御データメモリのなか
から選択し、選択した読取り制御データのうち文字パタ
ンの切出しに関わる読取り制御データを文字切出し部3
2へ、また選択した読取り制御データのうち文字パタン
の認識に関わる読取り制御データを文字認識部38へ出
力する(S13)。然る後、制御部17は文字切出し部
32及び文字認識部38を起動する。この場合、S6〜
S8は行なわれず従って最も確からしい認識結果に関し
てオペレータによる判断決定は行なわれずにS9〜S1
2が行なわれることとなる。
If the result of the determination in S5 is that the recognition result of the form format input is one, the control unit 17 reads the read control data corresponding to the recognition result, which has already been read. The read control data is selected from the control data memory, and the read control data relating to the character pattern cut out of the selected read control data is read by the character cutout unit 3.
2 and the read control data relating to the recognition of the character pattern among the selected read control data is output to the character recognition unit 38 (S13). Thereafter, the control unit 17 activates the character cutout unit 32 and the character recognition unit 38. In this case, S6 ~
S8 is not performed, so that the most probable recognition result is not determined by the operator, and S9 to S1 are not performed.
2 will be performed.

【0165】この変形例でも、帳票フォーマットの種別
を表す識別番号が記載されていない帳票であっても(図
2(B)の帳票参照)、帳票フォーマットの種別に対応
した読取り制御データを利用して、文字パタンの切出し
及び認識が行なえる。読取り制御データを利用すること
により、文字パタンの切出し及び認識のための処理を高
速に行なえる。また読取り制御データを利用することに
より、文字パタンの切出し及び認識のための処理を簡単
化できるので、装置のハードウエア規模或はソフトウエ
ア規模を小さくすることができる。
Even in this modification, even if the form does not have an identification number indicating the form format type (see the form in FIG. 2B), the read control data corresponding to the form format type is used. Thus, character patterns can be cut out and recognized. By using the read control data, processing for extracting and recognizing a character pattern can be performed at high speed. Also, by using the read control data, the processing for extracting and recognizing a character pattern can be simplified, so that the hardware scale or software scale of the apparatus can be reduced.

【0166】また帳票フォーマット未知の帳票イメージ
データ52と当該データ52の認識結果に対応する参照
データ54とを、同一の表示画面28aに同時に表示す
るようにしたので、オペレータは、最も確からしい認識
結果を判断決定する作業を、正確に行なえる。
Further, since the form image data 52 whose form format is unknown and the reference data 54 corresponding to the recognition result of the data 52 are displayed simultaneously on the same display screen 28a, the operator can recognize the most probable recognition result. Work can be performed accurately.

【0167】また帳票フォーマットの認識結果が1つで
ある場合には、最も確からしい認識結果に関してオペレ
ータによる判断決定は行なわれないので、オペレータの
作業軽減を図れると共に処理時間の短縮を図ることがで
きる。
When the recognition result of the form format is one, the operator does not make a decision regarding the most probable recognition result, so that the work of the operator can be reduced and the processing time can be shortened. .

【0168】次に図8の実施形態の変形例につき説明す
る。図12はこの変形例の文字読取り装置の全体的な動
作の流れを示す図である。この変形例は、動作が異なる
ほかは、図8の実施形態と同様の構成であるので、適宜
図8を参照されたい。
Next, a modification of the embodiment of FIG. 8 will be described. FIG. 12 is a diagram showing the overall operation flow of the character reading device of this modification. This modified example has the same configuration as that of the embodiment of FIG. 8 except for the operation, and therefore, please refer to FIG. 8 as appropriate.

【0169】まずスキャナ52により帳票イメージデー
タを得る。スキャナ52は帳票40の紙面40aを光学
的に走査して、量子化された電気信号例えば白黒2値の
電気信号から成る帳票イメージデータを生成し、このデ
ータを帳票イメージメモリ54に格納する。ここでは線
描画素を黒ビットで、背景画素を白ビットで表す。尚、
線描画素は紙面40a内に在る線を表す画素、背景画素
は紙面40aの地の部分(線の背景となる部分)を表す
画素である。
First, form image data is obtained by the scanner 52. The scanner 52 optically scans the paper surface 40a of the form 40, generates form image data composed of quantized electric signals, for example, black and white binary electric signals, and stores the data in the form image memory 54. Here, a line drawing element is represented by a black bit, and a background pixel is represented by a white bit. still,
The line drawing element is a pixel representing a line in the paper surface 40a, and the background pixel is a pixel representing a ground portion (a portion serving as a line background) of the paper surface 40a.

【0170】帳票イメージメモリ54に帳票イメージデ
ータが格納されると、制御部17は罫線抽出部18を起
動する(開始)。
When the form image data is stored in the form image memory 54, the control section 17 activates the ruled line extraction section 18 (start).

【0171】起動された罫線抽出部18は、帳票イメー
ジメモリ54に格納されている帳票イメージデータを走
査して、罫線パタンを抽出し、抽出した罫線パタンを罫
線パタンメモリ20に格納する(S1)。
The activated ruled line extracting unit 18 scans the form image data stored in the form image memory 54, extracts ruled line patterns, and stores the extracted ruled line patterns in the ruled line pattern memory 20 (S1). .

【0172】罫線抽出部18が罫線パタンの抽出を終了
すると、制御部17はフォーマット認識部24を起動す
る。
When the ruled line extraction unit 18 finishes extracting the ruled line pattern, the control unit 17 activates the format recognition unit 24.

【0173】起動されたフォーマット認識部24は、罫
線パタンメモリ20に格納されている罫線パタンを、フ
ォーマット認識辞書22に格納されている帳票フォーマ
ットの辞書データと照合し(S2)、この照合結果に基
づいて、罫線パタンにより表される帳票フォーマットを
認識し、この認識結果を制御部17へ出力する(S
3)。
The activated format recognizing unit 24 checks the ruled line pattern stored in the ruled line pattern memory 20 against the form data dictionary data stored in the format recognition dictionary 22 (S2). Based on this, the form format represented by the ruled line pattern is recognized, and this recognition result is output to the control unit 17 (S
3).

【0174】次に制御部17は、入力した帳票フォーマ
ットの認識結果が1つであったか否かを判定する(S
4)。
Next, the control unit 17 determines whether or not the recognition result of the input form format is one (S
4).

【0175】S4での判定で入力した帳票フォーマット
の認識結果は複数であったとの判定結果を得た場合、制
御部17は、入力した帳票フォーマットの認識結果に対
応した既知の帳票フォーマットの帳票イメージデータ
(参照用イメージデータ)を参照データとして参照デー
タメモリ26(56)から読み出し、読み出した参照デ
ータを表示部28に表示させると共に、当該認識結果を
得た帳票フォーマット未知の帳票イメージデータを帳票
イメージメモリ54から読み出して表示部28に表示さ
せ(S5)、然る後、オペレータによるフォーマット決
定信号の入力を待つ(S6)。
If the result of the determination in S4 is that the recognition result of the input form format is plural, the control unit 17 determines the image format of the known form format corresponding to the input recognition result of the form format. The data (reference image data) is read from the reference data memory 26 (56) as reference data, the read reference data is displayed on the display unit 28, and the form image data of an unknown form format obtained from the recognition result is converted to the form image. The data is read out from the memory 54 and displayed on the display unit 28 (S5), and thereafter, an input of a format determination signal by the operator is waited (S6).

【0176】オペレータは、参照データと帳票フォーマ
ット未知の帳票イメージデータとを比較参照し、最も確
からしい認識結果を判断決定し、入力デバイス30を操
作して、その判断結果に対応したフォーマット決定信号
を入力する。
The operator compares and refers to the reference data and the form image data of an unknown form format, determines and determines the most probable recognition result, operates the input device 30, and generates a format determination signal corresponding to the determined result. input.

【0177】制御部17は、オペレータによるフォーマ
ット決定信号の入力を確認すると(S6)、フォーマッ
ト決定信号に基づいて、読取り制御データの受け渡しを
行なう(S7)。この受け渡しは、制御部17と、読取
り制御データメモリ14及び文字認識系16との間で行
なわれる。
When the control unit 17 confirms the input of the format determination signal by the operator (S6), it transfers the read control data based on the format determination signal (S7). This transfer is performed between the control unit 17, the read control data memory 14, and the character recognition system 16.

【0178】ここでは読取り制御データメモリ14に
は、文字パタンの切出しに関わる読取り制御データと文
字パタンの認識に関わる読取り制御データとを記憶させ
てあり、制御部17は、フォーマット決定信号により決
定された認識結果に対応する読取り制御データを読取り
制御データメモリ14から読み出し、そして読み出した
読取り制御データのうち文字パタンの切出しに関わる読
取り制御データを文字切出し部32へ、また読み出した
読取り制御データのうち文字パタンの認識に関わる読取
り制御データを文字認識部38へ出力する。
Here, the read control data memory 14 stores read control data related to character pattern extraction and read control data related to character pattern recognition, and the control unit 17 is determined by a format determination signal. The read control data corresponding to the recognition result is read out from the read control data memory 14, and read control data relating to the character pattern cutting out of the read control data is read to the character cutout unit 32, and read control data is read out of the read control data. The read control data relating to the recognition of the character pattern is output to the character recognition unit 38.

【0179】次に制御部17は文字切出し部32及び文
字認識部38を起動する。すると文字切出し部32は、
帳票イメージデータから、1文字単位に、文字パタンを
切出し、切り出した文字パタンを文字パタンメモリ34
に格納する(S8)。文字認識部38は、切り出された
文字パタンを文字認識辞書36の辞書データと照合し
(S9)、この照合結果に基づいて文字パタンを認識
し、その認識結果を制御部17へ出力する(S10)。
制御部17は、1文字単位に、文字パタンの認識結果を
入力しそして帳票紙面40a上のすべての文字について
認識を終了したか否かを判定する(S11)。
Next, the control unit 17 activates the character extracting unit 32 and the character recognizing unit 38. Then, the character extraction unit 32
A character pattern is cut out from the form image data in units of one character, and the cut out character pattern is stored in a character pattern memory 34.
(S8). The character recognition unit 38 checks the extracted character pattern against the dictionary data of the character recognition dictionary 36 (S9), recognizes the character pattern based on the comparison result, and outputs the recognition result to the control unit 17 (S10). ).
The control unit 17 inputs a character pattern recognition result for each character, and determines whether or not the recognition has been completed for all characters on the form paper surface 40a (S11).

【0180】帳票紙面40a上のすべての文字について
認識を終了していなければ、文字切出し部32及び文字
認識部38は、制御部17の動作制御に従ってS8〜S
11の処理を繰り返す。また帳票紙面40a上のすべて
の文字について認識を終了したならば、帳票1枚分の文
字読取りを終了し、帳票1枚につき得た文字認識結果を
後段の装置へ出力する(終了)。
If the recognition of all the characters on the form paper 40a has not been completed, the character extracting unit 32 and the character recognizing unit 38 execute S8 to S8 in accordance with the operation control of the control unit 17.
Step 11 is repeated. When the recognition is completed for all the characters on the form paper 40a, the reading of characters for one form is completed, and the character recognition result obtained for one form is output to the subsequent device (end).

【0181】またS4の判定で入力した帳票フォーマッ
トの認識結果は1つであるとの判定結果を得た場合に
は、制御部17は当該認識結果に対応する読取り制御デ
ータを読取り制御データメモリ14から読み出し、読み
出した読取り制御データのうち文字パタンの切出しに関
わる読取り制御データを文字切出し部32へ、また読み
出した読取り制御データのうち文字パタンの認識に関わ
る読取り制御データを文字認識部38へ出力する(S1
2)。然る後、制御部17は文字切出し部32及び文字
認識部38を起動する。この場合、S5〜S7は行なわ
れず従って最も確からしい認識結果に関してオペレータ
による判断決定は行なわれずにS8〜S11が行なわれ
ることとなる。
If the result of the determination in S4 is that the recognition result of the form format input is one, the control unit 17 reads the read control data corresponding to the recognition result and reads the read control data memory 14 From the read control data read out to the character cutout unit 32, and read control data related to character pattern recognition among the readout read control data to the character recognition unit 38. Yes (S1
2). Thereafter, the control unit 17 activates the character cutout unit 32 and the character recognition unit 38. In this case, S5 to S7 are not performed, and thus the determination of the most probable recognition result is not performed by the operator, and S8 to S11 are performed.

【0182】この変形例でも、帳票フォーマットの種別
を表す識別番号が記載されていない帳票であっても(図
2(B)の帳票参照)、帳票フォーマットの種別に対応
した読取り制御データを利用して、文字パタンの切出し
及び認識が行なえる。読取り制御データを利用すること
により、文字パタンの切出し及び認識のための処理を高
速に行なえる。また読取り制御データを利用することに
より、文字パタンの切出し及び認識のための処理を簡単
化できるので、装置のハードウエア規模或はソフトウエ
ア規模を小さくすることができる。
Even in this modification, even if the form does not have an identification number indicating the form type (see the form in FIG. 2B), the read control data corresponding to the form format is used. Thus, character patterns can be cut out and recognized. By using the read control data, processing for extracting and recognizing a character pattern can be performed at high speed. Also, by using the read control data, the processing for extracting and recognizing a character pattern can be simplified, so that the hardware scale or software scale of the apparatus can be reduced.

【0183】また帳票フォーマット未知の帳票イメージ
データ52と当該データ52の認識結果に対応する参照
データ54とを、同一の表示画面28aに同時に表示す
るようにしたので、オペレータは、最も確からしい認識
結果を判断決定する作業を、正確に行なえる。
Further, since the form image data 52 whose form format is unknown and the reference data 54 corresponding to the recognition result of the data 52 are displayed on the same display screen 28a at the same time, the operator can obtain the most reliable recognition result. Work can be performed accurately.

【0184】また帳票フォーマットの認識結果が1つで
ある場合には、最も確からしい認識結果に関してオペレ
ータによる判断決定は行なわれないので、オペレータの
作業軽減を図れると共に処理時間の短縮を図ることがで
きる。
If the recognition result of the form format is one, the operator does not judge and determine the most probable recognition result, so that the operator's work can be reduced and the processing time can be shortened. .

【0185】次に図10の実施形態の変形例について説
明する。この変形例は、動作が異なるほかは、図10の
実施形態と同様の構成であるので、適宜図10を参照さ
れたい。以下、この変形例の文字読取り装置の全体的な
動作の流れにつき、図11を参照して説明する。
Next, a modification of the embodiment of FIG. 10 will be described. This modified example has the same configuration as that of the embodiment of FIG. 10 except for the operation, and therefore, please refer to FIG. 10 as appropriate. Hereinafter, the overall operation flow of the character reading device of this modification will be described with reference to FIG.

【0186】まずスキャナ52により帳票イメージデー
タを得る。スキャナ52は帳票40の紙面40aを光学
的に走査して、量子化された電気信号例えば白黒2値の
電気信号から成る帳票イメージデータを生成し、このデ
ータを帳票イメージメモリ54に格納する。ここでは線
描画素を黒ビットで、背景画素を白ビットで表す。尚、
線描画素は紙面40a内に在る線を表す画素、背景画素
は紙面40aの地の部分(線の背景となる部分)を表す
画素である。
First, form image data is obtained by the scanner 52. The scanner 52 optically scans the paper surface 40a of the form 40, generates form image data composed of quantized electric signals, for example, black and white binary electric signals, and stores the data in the form image memory 54. Here, a line drawing element is represented by a black bit, and a background pixel is represented by a white bit. still,
The line drawing element is a pixel representing a line in the paper surface 40a, and the background pixel is a pixel representing a ground portion (a portion serving as a line background) of the paper surface 40a.

【0187】帳票イメージメモリ54に帳票イメージデ
ータが格納されると、制御部17は罫線抽出部18を起
動する(開始)。
When the form image data is stored in the form image memory 54, the control unit 17 activates the ruled line extraction unit 18 (start).

【0188】起動された罫線抽出部18は、帳票イメー
ジメモリ54に格納されている帳票イメージデータを走
査して、罫線パタンを抽出し、抽出した罫線パタンを罫
線パタンメモリ20に格納する(S1)。
The activated ruled line extracting unit 18 scans the form image data stored in the form image memory 54, extracts ruled line patterns, and stores the extracted ruled line patterns in the ruled line pattern memory 20 (S1). .

【0189】罫線抽出部18が罫線パタンの抽出を終了
すると、制御部17はフォーマット認識部24を起動す
る。
When the ruled line extraction unit 18 finishes extracting the ruled line pattern, the control unit 17 activates the format recognition unit 24.

【0190】起動されたフォーマット認識部24は、罫
線パタンメモリ20に格納されている罫線パタンを、フ
ォーマット認識辞書22に格納されている帳票フォーマ
ットの辞書データと照合し(S2)、この照合結果に基
づいて、罫線パタンにより表される帳票フォーマットを
認識し、この認識結果を制御部17へ出力する(S
3)。
The activated format recognizing unit 24 checks the ruled line pattern stored in the ruled line pattern memory 20 against the dictionary data of the form format stored in the format recognition dictionary 22 (S2). Based on this, the form format represented by the ruled line pattern is recognized, and this recognition result is output to the control unit 17 (S
3).

【0191】次に制御部17は、入力した帳票フォーマ
ットの認識結果に対応した既知の帳票フォーマットの帳
票イメージデータ(参照用イメージデータ)を参照デー
タとして参照データメモリ26(56)から読み出しさ
らに入力した帳票フォーマットの認識結果に対応した読
取り制御データを参照データとして参照データメモリ2
6(14)から読み出し(S4)、然る後、制御部17
は入力した帳票フォーマットの認識結果が1つであった
か否かを判定する(S5)。
Next, the control unit 17 reads form image data (reference image data) of a known form format corresponding to the input form format recognition result from the reference data memory 26 (56) as reference data, and further inputs the read form image data. Reference data memory 2 using read control data corresponding to the recognition result of the form format as reference data
6 (14) (S4), and thereafter, the control unit 17
Determines whether the recognition result of the input form format is one (S5).

【0192】S5で入力した帳票フォーマットの認識結
果は複数であるとの判定結果を得た場合は、制御部17
は、参照データとして読み出した読取り制御データと既
知の帳票フォーマットの帳票イメージデータとを表示部
28に表示させると共に、当該認識結果を得た帳票フォ
ーマット未知の帳票イメージデータを帳票イメージメモ
リ54から読み出して表示部28に表示させ(S6)、
然る後、オペレータによるフォーマット決定信号の入力
を待つ(S7)。
If the determination result that the form format recognition result input in S5 is plural is obtained, the control unit 17
Displays the read control data read as reference data and the form image data in a known form format on the display unit 28, and reads out the form image data in an unknown form format obtained from the recognition result from the form image memory 54. It is displayed on the display unit 28 (S6),
Thereafter, it waits for the input of the format determination signal by the operator (S7).

【0193】オペレータは、参照データと帳票フォーマ
ット未知の帳票イメージデータとを比較参照し、最も確
からしい認識結果を判断決定し、入力デバイス30を操
作して、その判断結果に対応したフォーマット決定信号
を入力する。
The operator compares and refers to the reference data and the form image data of an unknown form format, determines and determines the most probable recognition result, and operates the input device 30 to generate a format determination signal corresponding to the determined result. input.

【0194】制御部17は、オペレータによるフォーマ
ット決定信号の入力を確認すると(S7)、フォーマッ
ト決定信号に基づいて、読取り制御データの受け渡しを
行なう(S8)。この受け渡しは、制御部17と、文字
認識系16との間で行なわれる。
Upon confirming the input of the format determination signal by the operator (S7), the control unit 17 transfers the read control data based on the format determination signal (S8). This transfer is performed between the control unit 17 and the character recognition system 16.

【0195】ここでは読取り制御データメモリ14に
は、文字パタンの切出しに関わる読取り制御データと文
字パタンの認識に関わる読取り制御データとを記憶させ
てあり、制御部17は、フォーマット決定信号により決
定された認識結果に対応する読取り制御データを読出し
済みの読取り制御データのなかから選択し、選択した読
取り制御データのうち文字パタンの切出しに関わる読取
り制御データを文字切出し部32へ、また選択した読取
り制御データのうち文字パタンの認識に関わる読取り制
御データを文字認識部38へ出力する。
Here, the read control data memory 14 stores read control data relating to character pattern extraction and read control data relating to character pattern recognition, and the control unit 17 is determined by a format determination signal. The read control data corresponding to the recognition result is selected from the read read control data, and the read control data relating to the character pattern cutout among the selected read control data is sent to the character cutout unit 32 and the selected read control data is read out. The read control data relating to the recognition of the character pattern among the data is output to the character recognition unit 38.

【0196】次に制御部17は文字切出し部32及び文
字認識部38を起動する。すると文字切出し部32は、
帳票イメージデータから、1文字単位に、文字パタンを
切出し、切り出した文字パタンを文字パタンメモリ34
に格納する(S9)。文字認識部38は、切り出された
文字パタンを文字認識辞書36の辞書データと照合し
(S10)、この照合結果に基づいて文字パタンを認識
し、その認識結果を制御部17へ出力する(S11)。
制御部17は、1文字単位に、文字パタンの認識結果を
入力しそして帳票紙面40a上のすべての文字について
認識を終了したか否かを判定する(S12)。
Next, the control unit 17 activates the character extracting unit 32 and the character recognizing unit 38. Then, the character extraction unit 32
A character pattern is cut out from the form image data in units of one character, and the cut out character pattern is stored in a character pattern memory 34.
(S9). The character recognition unit 38 checks the extracted character pattern against the dictionary data of the character recognition dictionary 36 (S10), recognizes the character pattern based on the comparison result, and outputs the recognition result to the control unit 17 (S11). ).
The control unit 17 inputs a character pattern recognition result for each character, and determines whether or not recognition has been completed for all characters on the form paper surface 40a (S12).

【0197】帳票紙面40a上のすべての文字について
認識を終了していなければ、文字切出し部32及び文字
認識部38は、制御部17の動作制御に従ってS9〜S
12の処理を繰り返す。また帳票紙面40a上のすべて
の文字について認識を終了したならば、帳票1枚分の文
字読取りを終了し、帳票1枚につき得た文字認識結果を
後段の装置へ出力する(終了)。
If the recognition has not been completed for all the characters on the form paper surface 40a, the character cutout unit 32 and the character recognition unit 38 execute S9 to S9 in accordance with the operation control of the control unit 17.
Step 12 is repeated. When the recognition is completed for all the characters on the form paper 40a, the reading of characters for one form is completed, and the character recognition result obtained for one form is output to the subsequent device (end).

【0198】またS5の判定で入力した帳票フォーマッ
トの認識結果は1つであるとの判定結果を得た場合に
は、制御部17は当該認識結果に対応する読取り制御デ
ータを既に読出し済みの読取り制御データメモリのなか
から選択し、選択した読取り制御データのうち文字パタ
ンの切出しに関わる読取り制御データを文字切出し部3
2へ、また選択した読取り制御データのうち文字パタン
の認識に関わる読取り制御データを文字認識部38へ出
力する(S13)。然る後、制御部17は文字切出し部
32及び文字認識部38を起動する。この場合、S6〜
S8は行なわれず従って最も確からしい認識結果に関し
てオペレータによる判断決定は行なわれずにS9〜S1
2が行なわれることとなる。
If the result of the determination in S5 is that the recognition result of the form format input is one, the control unit 17 reads the read control data corresponding to the recognition result, which has already been read. The read control data is selected from the control data memory, and the read control data relating to the character pattern cut out of the selected read control data is read by the character cutout unit 3.
2 and the read control data relating to the recognition of the character pattern among the selected read control data is output to the character recognition unit 38 (S13). Thereafter, the control unit 17 activates the character cutout unit 32 and the character recognition unit 38. In this case, S6 ~
S8 is not performed, so that the most probable recognition result is not determined by the operator, and S9 to S1 are not performed.
2 will be performed.

【0199】この変形例でも、帳票フォーマットの種別
を表す識別番号が記載されていない帳票であっても(図
2(B)の帳票参照)、帳票フォーマットの種別に対応
した読取り制御データを利用して、文字パタンの切出し
及び認識が行なえる。読取り制御データを利用すること
により、文字パタンの切出し及び認識のための処理を高
速に行なえる。また読取り制御データを利用することに
より、文字パタンの切出し及び認識のための処理を簡単
化できるので、装置のハードウエア規模或はソフトウエ
ア規模を小さくすることができる。
Even in this modification, even if the form does not include an identification number indicating the form format (see the form in FIG. 2B), the read control data corresponding to the form format is used. Thus, character patterns can be cut out and recognized. By using the read control data, processing for extracting and recognizing a character pattern can be performed at high speed. Also, by using the read control data, the processing for extracting and recognizing a character pattern can be simplified, so that the hardware scale or software scale of the apparatus can be reduced.

【0200】また帳票フォーマット未知の帳票イメージ
データ52と当該データ52の認識結果に対応する参照
データ54とを、同一の表示画面28aに同時に表示す
るようにしたので、オペレータは、最も確からしい認識
結果を判断決定する作業を、正確に行なえる。
Further, since the form image data 52 whose form format is unknown and the reference data 54 corresponding to the recognition result of the data 52 are simultaneously displayed on the same display screen 28a, the operator can recognize the most probable recognition result. Work can be performed accurately.

【0201】また帳票フォーマットの認識結果が1つで
ある場合には、最も確からしい認識結果に関してオペレ
ータによる判断決定は行なわれないので、オペレータの
作業軽減を図れると共に処理時間の短縮を図ることがで
きる。
When the recognition result of the form format is one, no judgment is made by the operator on the most probable recognition result, so that the operator's work can be reduced and the processing time can be shortened. .

【0202】上述した実施形態では、参照データが表示
部28に表示された場合に、オペレータが参照データに
対応する認識結果を選択指示するフォーマット決定信号
を入力し、このフォーマット決定信号に対応する読取り
制御データに基づいて文字パタンの切出し及び認識を行
なうようにしたが、参照データが表示部28に表示され
た場合に、参照データに対応する認識結果の中にオペレ
ータが満足できる認識結果を見出せなかったときは、オ
ペレータが適切な読取り制御データを指示する帳票フォ
ーマットの種別をフォーマット決定信号として入力デバ
イス30を介し制御部17に入力し、このフォーマット
決定信号として入力した帳票フォーマットの種別に基づ
いて文字パタンの切出し及び認識を行なうようにしても
良い。
In the above-described embodiment, when the reference data is displayed on the display unit 28, the operator inputs a format determination signal for selecting and instructing a recognition result corresponding to the reference data, and reads the data corresponding to the format determination signal. The character pattern is cut out and recognized based on the control data. However, when the reference data is displayed on the display unit 28, the operator cannot find a satisfactory recognition result among the recognition results corresponding to the reference data. In this case, the operator inputs the form format instructing appropriate read control data to the control unit 17 via the input device 30 as a format decision signal, and outputs a character based on the form format input as the format decision signal. Pattern extraction and recognition may be performed.

【0203】また上述したいずれの実施形態及び変形例
においても、スキャナ52にセットした帳票を押える押
え面を、帳票内に在る線と同様に線描画素に変換される
色例えば黒色として、帳票イメージデータを得、領域検
出に関わる周知の画像技術により、帳票イメージデータ
において帳票紙面に対応する領域を検出するようにして
も良い。この帳票紙面に対応する領域内の帳票イメージ
データを走査して、罫線パタンを検出し、またこの帳票
紙面に対応する領域内の帳票イメージデータを、帳票イ
メージメモリ54から読み出して表示部28の表示画面
に表示するようにすることができる。
Also, in any of the above-described embodiments and modifications, the pressing surface for pressing the form set on the scanner 52 is set to a color converted into a line drawing element, for example, black in the same manner as the line existing in the form, and the form image is formed. Data may be obtained, and a region corresponding to the form paper surface may be detected in the form image data by a well-known image technique related to region detection. The form image data in the area corresponding to the form paper is scanned to detect a ruled line pattern, and the form image data in the area corresponding to the form paper is read from the form image memory 54 and displayed on the display unit 28. It can be displayed on the screen.

【0204】[0204]

【発明の効果】上述した説明からも明らかなように、請
求項1のフォーマット認識装置によれば、帳票イメージ
データから罫線パタンを抽出し、抽出された罫線パタン
を帳票フォーマットの辞書データと照合して、帳票フォ
ーマットの認識を行なうので、帳票フォーマットの種別
を表す種別番号が帳票に印刷されていない場合でも、帳
票フォーマットを認識しその認識結果に基づいて帳票フ
ォーマットの種別を知ることができる。
As is clear from the above description, according to the format recognition apparatus of the first aspect, a ruled line pattern is extracted from form image data, and the extracted ruled line pattern is collated with dictionary data in a form format. Since the form format is recognized, even if the type number indicating the type of the form format is not printed on the form, the form format can be recognized and the type of the form format can be known based on the recognition result.

【0205】さらに表示部は、帳票フォーマットの認識
結果に対応した既知帳票フォーマットの特徴を表す参照
データを表示するので、オペレータは、参照データを参
照して最も確からしい認識結果を判断決定する作業を、
正確に行なえる。
Further, the display unit displays reference data representing the characteristics of the known form format corresponding to the recognition result of the form format, so that the operator refers to the reference data to determine and determine the most probable recognition result. ,
I can do it accurately.

【0206】また請求項4の文字読取り装置によれば、
帳票イメージデータから罫線パタンを抽出し、抽出され
た罫線パタンを帳票フォーマットの辞書データと照合し
て、帳票フォーマットの認識を行なうので、帳票フォー
マットの種別を表す種別番号が帳票に印刷されていない
場合でも、帳票フォーマットを認識しその認識結果に基
づいて帳票フォーマットの種別を知り、その種別に対応
した読取り制御データを用いて文字パタンの切出し及び
認識を行なうことができる。
According to the character reading device of the fourth aspect,
The ruled line pattern is extracted from the form image data, and the extracted ruled line pattern is compared with the dictionary data of the form format to recognize the form format. Therefore, when the type number indicating the type of the form format is not printed on the form. However, the form format can be recognized, the type of the form format can be known based on the recognition result, and the character pattern can be cut out and recognized using the read control data corresponding to the type.

【0207】さらに表示部は、帳票フォーマットの認識
結果に対応した既知帳票フォーマットの特徴を表す参照
データを表示するので、オペレータは、参照データを参
照して最も確からしい認識結果を判断決定する作業を、
正確に行なえる。
Furthermore, the display unit displays reference data representing the characteristics of the known form format corresponding to the form format recognition result, so that the operator refers to the reference data and determines and determines the most probable recognition result. ,
I can do it accurately.

【図面の簡単な説明】[Brief description of the drawings]

【図1】文字読取り装置及びフォーマット認識装置の実
施形態について構成の説明に供する機能ブロック図であ
る。
FIG. 1 is a functional block diagram for explaining a configuration of an embodiment of a character reading device and a format recognition device.

【図2】(A)及び(B)は帳票の説明に供する図であ
る。
FIGS. 2A and 2B are diagrams for explaining a form.

【図3】文字読取り装置及びフォーマット認識装置の実
施形態について動作の流れを説明するための図である。
FIG. 3 is a diagram for describing an operation flow of the embodiment of the character reading device and the format recognition device.

【図4】罫線抽出部の動作の流れを示す図である。FIG. 4 is a diagram showing a flow of operation of a ruled line extraction unit.

【図5】水平罫線パタン及び垂直罫線パタンを重ね合わ
せて格納した例を示す図である。
FIG. 5 is a diagram showing an example in which a horizontal ruled line pattern and a vertical ruled line pattern are stored in an overlapping manner.

【図6】(A)及び(B)は個別に格納した水平罫線パ
タン及び垂直罫線パタンの例を示す図である。
FIGS. 6A and 6B are diagrams illustrating examples of individually stored horizontal ruled line patterns and vertical ruled line patterns.

【図7】表示部の表示の説明に供する図である。FIG. 7 is a diagram provided for explanation of a display on a display unit.

【図8】文字読取り装置及びフォーマット認識装置の実
施形態の構成の説明に供する図である。
FIG. 8 is a diagram provided for describing a configuration of an embodiment of a character reading device and a format recognition device.

【図9】表示部の表示の説明に供する図である。FIG. 9 is a diagram provided for explanation of a display on a display unit.

【図10】文字読取り装置及びフォーマット認識装置の
実施形態の構成の説明に供する図である。
FIG. 10 is a diagram provided for describing a configuration of an embodiment of a character reading device and a format recognition device.

【図11】文字読取り装置及びフォーマット認識装置の
実施形態の変形例について動作の流れを説明するための
図である。
FIG. 11 is a diagram for describing an operation flow of a modification of the embodiment of the character reading device and the format recognition device.

【図12】文字読取り装置及びフォーマット認識装置の
実施形態の変形例について動作の流れを説明するための
図である。
FIG. 12 is a diagram for describing an operation flow of a modification of the embodiment of the character reading device and the format recognition device.

【符号の説明】[Explanation of symbols]

10:文字読取り装置 12:フォーマット認識系 14:読取り制御データメモリ 16:文字認識系 17:制御部 18:罫線抽出部 20:罫線パタンメモリ 22:フォーマット認識辞書 24:フォーマット認識部 26:参照データメモリ 28:表示部 30:入力デバイス 32:文字切出し部 34:文字パタンメモリ 36:文字認識辞書 38:文字認識部 10: Character reading device 12: Format recognition system 14: Read control data memory 16: Character recognition system 17: Control unit 18: Ruled line extraction unit 20: Ruled line pattern memory 22: Format recognition dictionary 24: Format recognition unit 26: Reference data memory 28: display unit 30: input device 32: character extraction unit 34: character pattern memory 36: character recognition dictionary 38: character recognition unit

───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平6−89365(JP,A) 特開 平7−254044(JP,A) 特開 平7−146913(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/00 - 9/82 ────────────────────────────────────────────────── ─── Continuation of the front page (56) References JP-A-6-89365 (JP, A) JP-A-7-254044 (JP, A) JP-A-7-146913 (JP, A) (58) Field (Int.Cl. 7 , DB name) G06K 9/00-9/82

Claims (9)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 帳票フォーマット未知の帳票イメージデ
ータから、帳票フォーマットを表す罫線パタンを抽出す
る罫線抽出部と、 抽出された罫線パタンを格納する罫線パタンメモリと、 帳票フォーマットの辞書データを保持するフォーマット
認識辞書と、 抽出された罫線パタンを、帳票フォーマットの辞書デー
タと照合し、該照合結果に基づいて罫線パタンにより表
される帳票フォーマットについて一又は複数の認識結果
を出力するフォーマット認識部と、 既知の帳票フォーマットの特徴を表す参照データを保持
する参照データメモリと、 前記帳票フォーマットの認識結果に対応した既知の帳票
フォーマットの参照データを表示する表示部と、 オペレータが表示された参照データに基づいて帳票フォ
ーマットの認識結果を決定する作業において、オペレー
タによる決定結果の入力操作に対応したフォーマット決
定信号を出力する入力デバイスとを備えるフォーマット
認識装置において、 種類の異なる参照データを、図形、記号、文字、色、輝
度若しくはこれらの組み合わせを異ならせることにより
区別して表示することを特徴とするフォーマット認識装
置。
1. A ruled line extraction unit for extracting a ruled line pattern representing a form format from form image data of an unknown form format, a ruled line pattern memory for storing the extracted ruled line pattern, and a format for holding dictionary data in the form format A recognition dictionary, a format recognition unit that checks the extracted ruled line pattern against dictionary data in a form format, and outputs one or a plurality of recognition results for a form format represented by the ruled line pattern based on the matching result; A reference data memory for holding reference data representing characteristics of the form format, a display unit for displaying reference data of a known form format corresponding to the recognition result of the form format, and an operator based on the displayed reference data. When deciding the recognition result of the form format And an input device that outputs a format determination signal corresponding to an input operation of a determination result by an operator, wherein a different type of reference data is used when a figure, a symbol, a character, a color, a luminance, or a combination thereof is different. A format recognizing apparatus characterized in that the format is distinguished and displayed.
【請求項2】 帳票フォーマット未知の帳票イメージデ
ータから、帳票フォーマットを表す罫線パタンを抽出す
る罫線抽出部と、 抽出された罫線パタンを格納する罫線パタンメモリと、 帳票フォーマットの辞書データを保持するフォーマット
認識辞書と、 抽出された罫線パタンを、帳票フォーマットの辞書デー
タと照合し、該照合結果に基づいて罫線パタンにより表
される帳票フォーマットについて一又は複数の認識結果
を出力するフォーマット認識部と、 既知の帳票フォーマットの特徴を表す参照データを保持
する参照データメモリと、 前記帳票フォーマットの認識結果に対応した既知の帳票
フォーマットの参照データを表示する表示部と、 オペレータが表示された参照データに基づいて帳票フォ
ーマットの認識結果を決定する作業において、オペレー
タによる決定結果の入力操作に対応したフォーマット決
定信号を出力する入力デバイスとを備えるフォーマット
認識装置において、 図形により表した帳票、行及びフィールドを、参照デー
タとして表示することを特徴とするフォーマット認識装
置。
2. A ruled line extraction unit for extracting a ruled line pattern representing a form format from form image data of an unknown form format, a ruled line pattern memory for storing the extracted ruled line pattern, and a format for holding dictionary data in the form format A recognition dictionary, a format recognition unit that checks the extracted ruled line pattern against dictionary data in a form format, and outputs one or a plurality of recognition results for a form format represented by the ruled line pattern based on the matching result; A reference data memory for holding reference data representing characteristics of the form format, a display unit for displaying reference data of a known form format corresponding to the recognition result of the form format, and an operator based on the displayed reference data. When deciding the recognition result of the form format A format recognition device comprising: an input device that outputs a format determination signal corresponding to an input operation of a determination result by an operator, wherein a form, a line, and a field represented by a graphic are displayed as reference data. Recognition device.
【請求項3】 帳票フォーマット未知の帳票イメージデ
ータから、帳票フォーマットを表す罫線パタンを抽出す
る罫線抽出部と、 抽出された罫線パタンを格納する罫線パタンメモリと、 帳票フォーマットの辞書データを保持するフォーマット
認識辞書と、 抽出された罫線パタンを、帳票フォーマットの辞書デー
タと照合し、該照合結果に基づいて罫線パタンにより表
される帳票フォーマットについて一又は複数の認識結果
を出力するフォーマット認識部と、 既知の帳票フォーマットの特徴を表す参照データを保持
する参照データメモリと、 前記帳票フォーマットの認識結果に対応した既知の帳票
フォーマットの参照データを表示する表示部と、 オペレータが表示された参照データに基づいて帳票フォ
ーマットの認識結果を決定する作業において、オペレー
タによる決定結果の入力操作に対応したフォーマット決
定信号を出力する入力デバイスとを備えるフォーマット
認識装置において、 参照データを、帳票幅、帳票高さ、帳票内の行数、帳票
内の行位置、帳票内のフィールド数、帳票内のフィール
ド位置、前記行内若しくはフィールド内の文字数、前記
行内若しくはフィールド内の文字ピッチ、前記行内若し
くはフィールド内の文字の字体、及び、前記行内若しく
はフィールド内の文字の字種のなかから選んだ一又は複
数の参照データとしたことを特徴とするフォーマット認
識装置。
3. A ruled line extracting unit for extracting a ruled line pattern representing a form format from form image data of an unknown form format, a ruled line pattern memory for storing the extracted ruled line pattern, and a format for holding dictionary data in the form format A recognition dictionary, a format recognition unit that checks the extracted ruled line pattern against dictionary data in a form format, and outputs one or a plurality of recognition results for a form format represented by the ruled line pattern based on the matching result; A reference data memory for holding reference data representing characteristics of the form format, a display unit for displaying reference data of a known form format corresponding to the recognition result of the form format, and an operator based on the displayed reference data. When deciding the recognition result of the form format And an input device for outputting a format determination signal corresponding to an input operation of a determination result by an operator, wherein the reference data is a form width, a form height, the number of lines in the form, a line position in the form. , The number of fields in the form, the field position in the form, the number of characters in the line or field, the character pitch in the line or field, the font of the characters in the line or field, and the characters in the line or field A format recognition device, wherein one or a plurality of reference data selected from character types is used.
【請求項4】 帳票フォーマット未知の帳票イメージデ
ータから、帳票フォーマットを表す罫線パタンを抽出す
る罫線抽出部と、 抽出された罫線パタンを格納する罫線パタンメモリと、 帳票フォーマットの辞書データを保持するフォーマット
認識辞書と、 抽出された罫線パタンを、帳票フォーマットの辞書デー
タと照合し、該照合結果に基づいて罫線パタンにより表
される帳票フォーマットについて一又は複数の認識結果
を出力するフォーマット認識部と、 既知の帳票フォーマットの特徴を表す参照データを保持
する参照データメモリと、 前記帳票フォーマットの認識結果に対応した既知の帳票
フォーマットの参照データを表示する表示部と、 オペレータが表示された参照データに基づいて帳票フォ
ーマットの認識結果を決定する作業において、オペレー
タによる決定結果の入力操作に対応したフォーマット決
定信号を出力する入力デバイスとを備えるフォーマット
認識装置において、 第一の参照データを、帳票内の行数、帳票内の行位置、
帳票内のフィールド数、及び、帳票内のフィールド位置
のなかから選んだ一又は複数の参照データとし、 第二の参照データを、帳票内の文字の字体及び帳票内の
文字の字種のなかから選んだ一又は複数の参照データと
し、 第二の参照データを、第一の参照データの表示位置の近
傍位置若しくは第一の参照データの表示位置と重なる位
置に、表示することを特徴とするフォーマット認識装
置。
4. A ruled line extracting unit for extracting a ruled line pattern representing a form format from form image data of an unknown form format, a ruled line pattern memory for storing the extracted ruled line pattern, and a format for holding dictionary data in the form format A recognition dictionary, a format recognition unit that checks the extracted ruled line pattern against dictionary data in a form format, and outputs one or a plurality of recognition results for a form format represented by the ruled line pattern based on the matching result; A reference data memory for holding reference data representing characteristics of the form format, a display unit for displaying reference data of a known form format corresponding to the recognition result of the form format, and an operator based on the displayed reference data. When deciding the recognition result of the form format And an input device that outputs a format determination signal corresponding to an input operation of a determination result by an operator, wherein the first reference data is the number of lines in the form, the line position in the form,
One or more reference data selected from the number of fields in the form and the field positions in the form, and the second reference data is determined from the font of the characters in the form and the character type of the characters in the form A format characterized by one or more selected reference data, and displaying the second reference data at a position near the display position of the first reference data or at a position overlapping with the display position of the first reference data. Recognition device.
【請求項5】 帳票フォーマット未知の帳票イメージデ
ータから、帳票フォーマットを表す罫線パタンを抽出す
る罫線抽出部と、 抽出された罫線パタンを格納する罫線パタンメモリと、 帳票フォーマットの辞書データを保持するフォーマット
認識辞書と、 抽出された罫線パタンを、帳票フォーマットの辞書デー
タと照合し、該照合結果に基づいて罫線パタンにより表
される帳票フォーマットについて一又は複数の認識結果
を出力するフォーマット認識部と、 既知の帳票フォーマットの特徴を表す参照データを保持
する参照データメモリと、 前記帳票フォーマットの認識結果に対応した既知の帳票
フォーマットの参照データを表示する表示部と、 オペレータが表示された参照データに基づいて帳票フォ
ーマットの認識結果を決定する作業において、オペレー
タによる決定結果の入力操作に対応したフォーマット決
定信号を出力する入力デバイスとを備えるフォーマット
認識装置において、 図形により表した行を、第一の参照データとして表示
し、 行内の文字の字種若しくは字体を、第二の参照データと
して表示し、 第二の参照データを、第一の参照データの表示位置の近
傍位置若しくは第一の参照データの表示位置と重なる位
置に、表示することを特徴とするフォーマット認識装
置。
5. A ruled line extraction unit for extracting a ruled line pattern representing a form format from form image data of an unknown form format, a ruled line pattern memory for storing the extracted ruled line pattern, and a format for holding dictionary data in the form format A recognition dictionary, a format recognition unit that checks the extracted ruled line pattern against dictionary data in a form format, and outputs one or a plurality of recognition results for a form format represented by the ruled line pattern based on the matching result; A reference data memory for holding reference data representing characteristics of the form format, a display unit for displaying reference data of a known form format corresponding to the recognition result of the form format, and an operator based on the displayed reference data. When deciding the recognition result of the form format And an input device for outputting a format determination signal corresponding to an input operation of a determination result by an operator, wherein a line represented by a graphic is displayed as first reference data, and a character type of a character in the line is displayed. Alternatively, the font is displayed as second reference data, and the second reference data is displayed at a position near the display position of the first reference data or at a position overlapping with the display position of the first reference data. Format recognition device.
【請求項6】 帳票フォーマット未知の帳票イメージデ
ータから、帳票フォーマットを表す罫線パタンを抽出す
る罫線抽出部と、 抽出された罫線パタンを格納する罫線パタンメモリと、 帳票フォーマットの辞書データを保持するフォーマット
認識辞書と、 抽出された罫線パタンを、帳票フォーマットの辞書デー
タと照合し、該照合結果に基づいて罫線パタンにより表
される帳票フォーマットについて一又は複数の認識結果
を出力するフォーマット認識部と、 既知の帳票フォーマットの特徴を表す参照データを保持
する参照データメモリと、 前記帳票フォーマットの認識結果に対応した既知の帳票
フォーマットの参照データを表示する表示部と、 オペレータが表示された参照データに基づいて帳票フォ
ーマットの認識結果を決定する作業において、オペレー
タによる決定結果の入力操作に対応したフォーマット決
定信号を出力する入力デバイスとを備えるフォーマット
認識装置において、 図形により表したフィールドを、第一の参照データとし
て表示し、 フィールド内の文字の字種若しくは字体を、第二の参照
データとして表示し、 第二の参照データを、第一の参照データの表示位置の近
傍位置若しくは第一の参照データの表示位置と重なる位
置に、表示することを特徴とするフォーマット認識装
置。
6. A ruled line extraction unit for extracting a ruled line pattern representing a form format from form image data of an unknown form format, a ruled line pattern memory for storing the extracted ruled line pattern, and a format for holding dictionary data in the form format A recognition dictionary, a format recognition unit that checks the extracted ruled line pattern against dictionary data in a form format, and outputs one or a plurality of recognition results for a form format represented by the ruled line pattern based on the matching result; A reference data memory for holding reference data representing characteristics of the form format, a display unit for displaying reference data of a known form format corresponding to the recognition result of the form format, and an operator based on the displayed reference data. When deciding the recognition result of the form format And an input device for outputting a format determination signal corresponding to an input operation of a determination result by an operator, wherein a field represented by a graphic is displayed as first reference data, and a character of a character in the field is displayed. Displaying the type or font as the second reference data, and displaying the second reference data at a position near the display position of the first reference data or at a position overlapping with the display position of the first reference data. Characteristic format recognition device.
【請求項7】 帳票フォーマット未知の帳票イメージデ
ータと、当該イメージデータに対応する前記参照データ
とを、重ね合わせて表示することを特徴とする請求項3
〜6のいずれかに記載のフォーマット認識装置。
7. The form image data of an unknown form format and the reference data corresponding to the image data are displayed in a superimposed manner.
7. The format recognition device according to any one of claims 1 to 6.
【請求項8】 帳票フォーマットが既知の帳票から予め
得た参照用イメージデータと、前記参照データとを、重
ね合わせて表示することを特徴とする請求項3〜6のい
ずれかに記載のフォーマット認識装置。
8. The format recognition apparatus according to claim 3, wherein reference image data previously obtained from a form with a known form format and the reference data are displayed in a superimposed manner. apparatus.
【請求項9】 帳票フォーマットの認識処理を行なうフ
ォーマット認識系と、読取り制御データを保持する制御
データメモリと、帳票フォーマットの認識結果に対応し
た読取り制御データに従って文字の認識処理を行なう文
字認識系とを備え、 文字認識系は、帳票イメージデータから文字パタンを切
り出す文字切出し部と、切り出された文字パタンを格納
する文字パタンメモリと、文字の辞書データを保持する
文字認識辞書と、切り出された文字パタンを、文字の辞
書データと照合し、該照合結果に基づいて文字パタンを
認識する文字認識部とを備え、 フォーマット認識系を、帳票フォーマット未知の帳票イ
メージデータから、帳票フォーマットを表す罫線パタン
を抽出する罫線抽出部と、抽出された罫線パタンを格納
する罫線パタンメモリと、帳票フォーマットの辞書デー
タを保持するフォーマット認識辞書と、抽出された罫線
パタンを、帳票フォーマットの辞書データと照合し、該
照合結果に基づいて罫線パタンにより表される帳票フォ
ーマットについて一又は複数の認識結果を出力するフォ
ーマット認識部とにより構成し、 既知の帳票フォーマットの特徴を表す参照データを保持
する参照データメモリと、前記帳票フォーマットの認識
結果に対応した既知の帳票フォーマットの参照データを
表示する表示部と、オペレータが表示された参照データ
に基づいて帳票フォーマットの認識結果を決定する作業
において、オペレータによる決定結果の入力操作に対応
したフォーマット決定信号を出力する入力デバイスとを
設け、 文字認識系は、フォーマット決定信号に対応する読取り
制御データに従って、文字の認識処理を行なうことを特
徴とする文字読取り装置において、 参照データメモリを、制御データメモリとし、表示部
は、参照データとして読取り制御データを表示すること
を特徴とする文字読取り装置。
9. A format recognition system for recognizing a form format, a control data memory for holding read control data, and a character recognition system for recognizing characters in accordance with read control data corresponding to a recognition result of the form format. The character recognition system includes a character extraction unit that extracts a character pattern from the form image data, a character pattern memory that stores the extracted character pattern, a character recognition dictionary that holds dictionary data of the character, and a extracted character. A character recognition unit that matches the pattern with the character dictionary data and recognizes the character pattern based on the result of the matching. A format recognition system is provided for converting a ruled line pattern representing a form format from form image data of an unknown form format. Ruled line extraction unit to be extracted, and a ruled line pattern memory for storing the extracted ruled line pattern A format recognition dictionary holding dictionary data in a form format, and comparing the extracted ruled line pattern with dictionary data in a form format, and performing one or more recognitions on a form format represented by the ruled line pattern based on the matching result. A reference data memory configured to include a format recognizing unit that outputs a result and holding reference data representing characteristics of a known form format; and a display that displays reference data of a known form format corresponding to the recognition result of the form format. And an input device that outputs a format determination signal corresponding to the input operation of the determination result by the operator in the operation of determining the recognition result of the form format based on the displayed reference data by the operator. , Read corresponding to format decision signal A character reading device for performing a character recognition process in accordance with control data, wherein the reference data memory is a control data memory, and the display unit displays reading control data as reference data. apparatus.
JP06497096A 1996-03-21 1996-03-21 Format recognition device and character reader Expired - Fee Related JP3276555B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP06497096A JP3276555B2 (en) 1996-03-21 1996-03-21 Format recognition device and character reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP06497096A JP3276555B2 (en) 1996-03-21 1996-03-21 Format recognition device and character reader

Publications (2)

Publication Number Publication Date
JPH09259222A JPH09259222A (en) 1997-10-03
JP3276555B2 true JP3276555B2 (en) 2002-04-22

Family

ID=13273424

Family Applications (1)

Application Number Title Priority Date Filing Date
JP06497096A Expired - Fee Related JP3276555B2 (en) 1996-03-21 1996-03-21 Format recognition device and character reader

Country Status (1)

Country Link
JP (1) JP3276555B2 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000251012A (en) * 1999-03-01 2000-09-14 Hitachi Ltd Method and system for document processing
JP4416890B2 (en) 1999-12-20 2010-02-17 富士通株式会社 Form identification device
JP4881722B2 (en) * 2006-12-28 2012-02-22 日立コンピュータ機器株式会社 Form identification device and form identification program
JP2009025856A (en) * 2007-07-17 2009-02-05 Hitachi Computer Peripherals Co Ltd Document discrimination program and document discrimination device
JP4867941B2 (en) * 2008-03-24 2012-02-01 沖電気工業株式会社 Form processing method, form processing program, form processing apparatus, and form processing system

Also Published As

Publication number Publication date
JPH09259222A (en) 1997-10-03

Similar Documents

Publication Publication Date Title
KR100658119B1 (en) Apparatus and Method for Recognizing Character
US4933979A (en) Data reading apparatus for reading data from form sheet
US4903312A (en) Character recognition with variable subdivisions of a character region
US5164996A (en) Optical character recognition by detecting geo features
US4891750A (en) Optical character recognition by forming and detecting matrices of geo features
US20020051574A1 (en) Character recognition method, program and recording medium
JP2002015280A (en) Device and method for image recognition, and computer- readable recording medium with recorded image recognizing program
JP3276555B2 (en) Format recognition device and character reader
JP3573945B2 (en) Format recognition device and character reading device
JP3268552B2 (en) Area extraction method, destination area extraction method, destination area extraction apparatus, and image processing apparatus
JP4810853B2 (en) Character image cutting device, character image cutting method and program
JP3276554B2 (en) Format recognition device and character reader
JP2917427B2 (en) Drawing reader
JP2537973B2 (en) Character recognition device
JP3437296B2 (en) High-speed character string extraction device
JPH07160810A (en) Character recognizing device
JPH0573725A (en) Hand-written character and graphic recognition device
JP2993533B2 (en) Information processing device and character recognition device
JPH05135204A (en) Character recognition device
JPH05274472A (en) Image recognizing device
JPH05174179A (en) Document image processor
JPH0632074B2 (en) Normalization method
JP2001092912A (en) Device and method for inputting data
JPH05282487A (en) Character recognizing device
JPH0728933A (en) Character recognition device

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20020129

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090208

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090208

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100208

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110208

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110208

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120208

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130208

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140208

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees