JP2000268106A - Document processor and program recording medium therefor - Google Patents

Document processor and program recording medium therefor

Info

Publication number
JP2000268106A
JP2000268106A JP11067636A JP6763699A JP2000268106A JP 2000268106 A JP2000268106 A JP 2000268106A JP 11067636 A JP11067636 A JP 11067636A JP 6763699 A JP6763699 A JP 6763699A JP 2000268106 A JP2000268106 A JP 2000268106A
Authority
JP
Japan
Prior art keywords
character string
item
change
character
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11067636A
Other languages
Japanese (ja)
Inventor
Masaharu Meki
正治 目木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP11067636A priority Critical patent/JP2000268106A/en
Publication of JP2000268106A publication Critical patent/JP2000268106A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To easily set the character string of an item name or the like by character-recognizing the character string on a document image at the time of setting the slip form based on the slip image. SOLUTION: A CPU 1 segments image data from an item name printing area on a document image screen, character-recognizes them, retrieves an item name index table based on the recognized character string and displays the retrieved result as candidates at a display device 6. When a desired candidate is selected from the candidate display by an input device 5, the CPU 1 registers the candidate character string in a slip form file as the item name.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】この発明は、所望する帳票フ
ォームを設計する帳票処理装置およびそのプログラム記
録媒体に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a form processing apparatus for designing a desired form, and a program recording medium therefor.

【0002】[0002]

【従来の技術】従来、伝票、請求書、官公庁提出の届け
出用紙などのプレプリント用紙(定型用紙)に対する帳
票フォームを設計する際に、イメージスキャナ等で読み
取った帳票イメージを表示画面上に表示出力させ、この
帳票イメージ画面を背景としてその上に帳票の出力フォ
ームを入力指定すると、それに応じた出力フォームが設
定される。このようにして帳票フォームを設定した状態
において帳票データを入力すると、入力された帳票デー
タは帳票フォーム通りに割り付けられて印刷出力され
る。ところで、帳票フォームの設定時には、印刷対象項
目毎にその割付位置および大きさを設定すると共に、項
目名を設定するようにしている。ここで、項目名はキー
ボードから文字列データを入力してかな漢字変換し、そ
の確定文字列を該当項目位置に移動したり、各種の項目
名を選択候補として一覧表示させ、その中から任意に選
択指定した項目名を該当項目位置に移動することによっ
て設定するようにしていた。また、帳票フォームを設定
した後において、帳票の出力形式が変更された場合に
は、項目名と項目位置との対応関係が崩れてしまうた
め、フォームの設定を最初からやり直すようにしてい
た。
2. Description of the Related Art Conventionally, when designing a form for preprinted paper (standard paper) such as a slip, an invoice, and a report submitted by a government office, a form image read by an image scanner or the like is displayed on a display screen. When a form output form is input and designated on the form image screen as a background, an output form corresponding to the form is set. When the form data is input in the state where the form is set in this way, the input form data is allocated according to the form and printed out. By the way, when the form is set, the layout position and size are set for each print target item, and the item name is set. Here, the item name is converted into Kana-Kanji characters by inputting character string data from the keyboard, moving the finalized character string to the corresponding item position, displaying various item names as selection candidates, and arbitrarily selecting from among them The specified item name was set by moving it to the corresponding item position. Further, if the output form of the form is changed after the form is set, the correspondence between the item name and the item position is broken, so the setting of the form is restarted from the beginning.

【0003】[0003]

【発明が解決しようとする課題】しかしながら、印刷対
象項目毎にその項目名を設定することは、作業量が増大
するため、帳票フォームの設計を困難なものとしてい
た。また、各種の項目名が選択候補として一覧表示され
ている一覧画面の中から所望の候補を選択する場合、多
数の項目名から所望の項目名を探し出すことも容易では
なく、類似する項目名を間違って選択してしまうことも
あった。一方、帳票の出力形式が変更された場合に、フ
ォームの設計を最初からやり直すことも作業効率を悪く
する要因となり、また変更部分のみを部分修正すること
ができたとしても、項目名と項目位置との対応関係を混
同したり、修正ミスの危険があるため、部分修正を行う
場合であっても、全ての項目についてその対応関係を確
認しながら修正作業を行わなければならず、必ずしも作
業性を改善できるものとは言えなかった。第1の発明の
課題は、帳票イメージをベースにしてその帳票フォーム
を設定する際に、帳票イメージ上の文字列を文字認識す
ることで、項目名等の文字列を容易に設定できるように
することである。第2の発明の課題は、帳票イメージを
ベースにしてその帳票フォームを設計した後において、
その帳票の出力形式が変更された場合であっても、変更
後の帳票イメージを解析した解析結果と変更前の帳票フ
ォーム情報とに基づいて帳票フォームを自動的に修正で
きるようにすることである。
However, setting an item name for each item to be printed increases the amount of work, thereby making it difficult to design a form. Further, when a desired candidate is selected from a list screen in which various item names are displayed as selection candidates, it is not easy to find a desired item name from a large number of item names. Sometimes they made the wrong choice. On the other hand, if the output format of the form is changed, re-designing the form from the beginning will also reduce work efficiency, and even if only the changed part can be modified, the item name and item position There is a danger of confusing the correspondence with, and there is a risk of correction mistakes, so even when making partial corrections, it is necessary to perform correction work while confirming the correspondence relationship for all items, and it is not necessarily workability Could not be improved. An object of the first invention is to make it possible to easily set a character string such as an item name by recognizing a character string on the form image when setting the form based on the form image. That is. The problem of the second invention is that after designing the form based on the form image,
Even if the output format of the form is changed, it is possible to automatically correct the form based on the analysis result obtained by analyzing the changed form image and the form information before the change. .

【0004】[0004]

【課題を解決するための手段】この発明の手段は次の通
りである。請求項1記載の発明は、所望する帳票フォー
ムを設計する際に、予め読み取られた帳票イメージを表
示出力させると共に、この帳票イメージ画面を背景とし
てその帳票の出力フォームを設定する帳票処理装置にお
いて、帳票イメージ画面上の文字列領域内からイメージ
データを切り出して文字認識を行う文字認識手段と、こ
の文字列認識手段によって文字認識された文字列に基づ
いて文字列候補索引テーブルを検索し、その検索結果を
候補表示する候補文字列変換手段と、前記候補表示され
ている文字列の中から所望の候補文字列が選択された際
に、その選択候補文字列を帳票イメージ上の前記文字列
領域に対応する帳票フォーム情報として設定するフォー
ム情報設定手段とを具備するものである。なお、この発
明は次のようなものであってもよい。 (1)、帳票イメージ画面上の各種の文字列領域のうち
所望する文字列領域を任意に指定する領域指定手段を設
け、前記文字認識手段は前記領域指定手段によって指定
された文字列領域内からイメージデータを切り出して文
字認識を行う。 (2)、前記候補文字列変換は、前記文字認識手段によ
って文字認識された文字列に基づいてその種類を判別す
ると共にその判別結果に基づいて種類別文字列候補索引
テーブルを種類毎に検索する。 (3)、帳票イメージ上の文字列領域に対応付けられて
いるデータ印刷用の印刷対象領域を特定するための範囲
枠を帳票イメージ画面上にガイダンス表示する表示制御
手段と、前記範囲枠の位置/大きさを帳票イメージ画面
上で編集する編集手段とを設け、前記フォーム情報設定
手段は前記編集手段によって編集された範囲枠に基づい
て印刷対象項目を決定し、この印刷対象項目を帳票フォ
ーム情報として設定する。 (4)、帳票の出力形式が変更された際に、変更後の帳
票イメージ上の文字列領域内からイメージデータを切り
出して文字認識すると共に、文字認識された文字列と前
記フォーム情報設定手段によって設定された変更前の文
字列とを比較し、両者の不一致が検出された場合に、変
更前の設定文字列を変更後の認識文字列に書き替える。
請求項1記載の発明においては、帳票イメージ画面上の
文字列領域内からイメージデータを切り出して文字認識
すると共に、文字認識された文字列に基づいて文字列候
補索引テーブルを検索し、その検索結果が候補表示され
る。その中から所望の候補文字列が選択された際に、そ
の候補文字列を帳票イメージ上の前記文字列領域に対応
する帳票フォーム情報として設定する。したがって、帳
票イメージをベースにしてその帳票フォームを設定する
際に、帳票イメージ上の文字列を文字認識することで、
項目名等の文字列を容易に設定することができる。
The means of the present invention are as follows. The invention according to claim 1 is a form processing apparatus for displaying and outputting a form image read in advance when designing a desired form, and setting an output form of the form with the form image screen as a background. Character recognition means for extracting character data by extracting image data from a character string area on a form image screen, and searching a character string candidate index table based on the character strings recognized by the character string recognition means, Candidate character string conversion means for displaying the result as a candidate, and when a desired candidate character string is selected from the candidate displayed character strings, the selected candidate character string is stored in the character string area on the form image. Form information setting means for setting as corresponding form information. The present invention may be as follows. (1) An area designating means for arbitrarily designating a desired character string area among various character string areas on a form image screen is provided, and the character recognizing means is provided from within the character string area designated by the area designating means. Cut out image data and perform character recognition. (2) In the candidate character string conversion, the type is determined based on the character string recognized by the character recognition unit, and the type-specific character string candidate index table is searched for each type based on the determination result. . (3) display control means for providing guidance on a form image screen for specifying a range frame for specifying a print target area for data printing associated with a character string area on the form image, and a position of the range frame Editing means for editing the size on a form image screen, wherein the form information setting means determines a print target item based on the range frame edited by the editing means, and converts the print target item into form form information. Set as (4) When the form output format is changed, image data is cut out from the character string area on the changed form image and characters are recognized, and the recognized character string and the form information setting means are used. The set character string before the change is compared with the set character string, and when a mismatch is detected between the two, the set character string before the change is rewritten with the recognized character string after the change.
According to the first aspect of the present invention, image data is cut out from a character string area on a form image screen, characters are recognized, and a character string candidate index table is searched based on the recognized character strings. Is displayed as a candidate. When a desired candidate character string is selected from among them, the candidate character string is set as form form information corresponding to the character string area on the form image. Therefore, when setting the form based on the form image, character recognition of the character string on the form image
Character strings such as item names can be easily set.

【0005】請求項6記載の発明は、所望する帳票フォ
ームを設計する際に、予め読み取られた帳票イメージを
表示出力させると共に、この帳票イメージ画面を背景と
してその帳票の出力フォームを設定する帳票処理装置に
おいて、帳票の出力形式を定義する各項目毎に項目割付
位置と、項目内の文字列と、この文字列の基準位置と項
目割付位置との相対値とを帳票フォーム情報として記憶
するフォーム情報記憶手段と、帳票の出力形式が変更さ
れた際に、変更後の帳票イメージ上の文字列領域内から
イメージデータを切り出して文字認識する文字認識手段
と、この文字認識手段によって文字認識された文字列と
前記フォーム情報記憶手段内の変更前の文字列とを比較
し、両者の不一致が検出された際に、変更後の文字列基
準位置を検出する位置検出手段と、この位置検出手段に
よって検出された文字列基準位置と前記フォーム情報記
憶手段内の項目割付位置とに基づいてそれらの変化量を
算出すると共に、この変化量と前記フォーム情報記憶手
段内の相対値とに基づいて変更後の項目割付位置を算出
する算出手段と、この算出手段によって求められた項目
割付位置に基づいて前記フォーム情報記憶手段内の項目
割付位置を修正する修正手段とを具備するものである。
なお、この発明は次のようなものであってもよい。 (1)、前記位置検出手段によって変更前後の文字列の
不一致が検出された際に、前記修正手段は変更前の項目
割付位置を変更後の項目割付位置に書き替える他、変更
前の文字列を変更後の文字列に書き替える。 (2)、前記位置検出手段によって変更前後の文字列の
不一致が検出された際に、変更前後の文字列を対応表示
させ、割付変更が指示された際に、前記修正手段は帳票
フォーム情報の修正を行う。 (3)、前記文字認識手段は帳票イメージ上の文字列領
域内からイメージデータを切り出す際に、データが集合
している集合部分を切り出し枠として決定し、この切り
出し枠内のイメージデータを抽出して文字認識し、前記
位置検出手段は前記切り出し枠の所定位置を文字列基準
位置として検出する。請求項6記載の発明においては、
帳票の出力形式を定義する各項目毎に項目割付位置と、
項目内の文字列と、この文字列の基準位置と項目割付位
置との相対値とが帳票フォーム情報として設定されてい
る場合において、帳票の出力形式が変更された際に変更
後の帳票イメージ上の文字列領域内からイメージデータ
を切り出して文字認識すると共に、この認識文字列と変
更前の文字列とを比較する。この結果、両者の不一致が
検出されると、変更後の文字列の基準位置を検出し、こ
の基準位置と変更前の項目割付位置とに基づいてそれら
の変化量を算出する他、この変化量と変更前の相対値と
に基づいて変更後の項目割付位置を算出し、この算出値
に基づいて変更前の項目割付位置を修正する。したがっ
て、帳票イメージをベースにしてその帳票フォームを設
計した後において、その帳票の出力形式が変更された場
合であっても、変更後の帳票イメージを解析した解析結
果と変更前の帳票フォーム情報とに基づいて帳票フォー
ムを自動的に修正することができる。
According to a sixth aspect of the present invention, there is provided a form processing apparatus for displaying and outputting a form image read in advance when designing a desired form, and setting an output form of the form with the form image screen as a background. In the apparatus, form information for storing an item allocation position for each item defining an output format of a form, a character string in the item, and a relative value between the reference position of the character string and the item allocation position as form form information Storage means, when the output format of the form is changed, character recognition means for cutting out image data from a character string area on the changed form image and recognizing characters, and character recognition by the character recognition means A column is compared with a character string before change in the form information storage means, and when a mismatch between the two is detected, a character string reference position after change is detected. Position detecting means, calculating the amount of change based on the character string reference position detected by the position detecting means and the item allocation position in the form information storing means, and calculating the change amount and the form information storing means. Calculating means for calculating the changed item allocation position based on the relative value in the correction information, and correcting means for correcting the item allocation position in the form information storage means based on the item allocation position obtained by the calculating means. It is provided with.
The present invention may be as follows. (1) When the position detecting unit detects a mismatch between the character strings before and after the change, the correcting unit rewrites the item allocation position before the change to the item allocation position after the change, and also changes the character string before the change. Is replaced with the changed character string. (2) When the position detecting means detects a mismatch between the character strings before and after the change, the character strings before and after the change are displayed correspondingly, and when an assignment change is instructed, the correcting means sets the form information of the form. Make corrections. (3) When the character recognizing means cuts out the image data from the character string area on the form image, the character recognizing means determines a set portion where the data is set as a cutout frame, and extracts the image data in the cutout frame. The position detection means detects a predetermined position of the cutout frame as a character string reference position. In the invention according to claim 6,
Item allocation position for each item that defines the output format of the form,
When the character string in the item and the relative value between the reference position of this character string and the item allocation position are set as the form information, when the output format of the form is changed, the changed form image And character recognition by extracting image data from the character string area of the character string, and comparing the recognized character string with the character string before change. As a result, when a mismatch is detected between the two, the reference position of the character string after the change is detected, and the amount of change is calculated based on the reference position and the item allocation position before the change. The post-change item allocation position is calculated based on the pre-change relative value, and the pre-change item allocation position is corrected based on the calculated value. Therefore, after designing the form based on the form image, even if the output format of the form is changed, the analysis result obtained by analyzing the changed form image and the form form information before the change The form can be automatically corrected based on the form.

【0006】[0006]

【発明の実施の形態】以下、図1〜図12を参照してこ
の発明の一実施形態を説明する。図1は帳票処理装置の
全体構成を示したブロック図である。CPU1は各種プ
ログラムにしたがってこの帳票処理装置の全体動作を制
御する中央演算処理装置である。記憶装置2はオペレー
ティングシステムや各種アプリケーションプログラム、
データベース、文字フォントデータ等が予め格納されて
いる記憶媒体3やその駆動系を有している。この記憶媒
体3は固定的に設けたもの、もしくは着脱自在に装着可
能なものであり、フロッピー(登録商標)ディスク、ハ
ードディスク、光ディスク、RAMカード等の磁気的・
光学的記憶媒体、半導体メモリによって構成されてい
る。また、記憶媒体3内のプログラムやデータは、必要
に応じてCPU1の制御により、RAM4にロードされ
る。更に、CPU1は通信回線等を介して他の機器側か
ら送信されて来たプログラム、データを受信して記憶媒
体3に格納したり、他の機器側に設けられている記憶媒
体に格納されているプログラム、データを通信回線等を
介して使用することもできる。また、CPU1にはその
入出力周辺デバイスである入力装置5、表示装置6、印
刷装置7、イメージスキャナ8がバスラインを介して接
続されており、入出力プログラムにしたがってCPU1
はそれらの動作を制御する。入力装置5は文字列データ
等を入力したり、各種コマンドを入力するキーボード、
マウス等のポインティングデバイスを有している。な
お、表示装置6は液晶表示装置やCRT表示装置あるい
はプラズマ表示装置等であり、また印刷装置7は熱転写
やインクジェットなどのノンインパクトプリンタあるい
はドットインパクトプリンタである。イメージスキャナ
8はプレプリント用紙上を走査することによって帳票イ
メージを読み取る定置式スキャナである。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of the present invention will be described below with reference to FIGS. FIG. 1 is a block diagram showing the overall configuration of the form processing apparatus. The CPU 1 is a central processing unit that controls the overall operation of the form processing device according to various programs. The storage device 2 includes an operating system and various application programs,
It has a storage medium 3 in which a database, character font data and the like are stored in advance, and a drive system therefor. The storage medium 3 is fixedly provided or can be removably mounted, and can be a magnetic medium such as a floppy (registered trademark) disk, hard disk, optical disk, RAM card, or the like.
It is composed of an optical storage medium and a semiconductor memory. The programs and data in the storage medium 3 are loaded into the RAM 4 under the control of the CPU 1 as needed. Further, the CPU 1 receives programs and data transmitted from other devices via a communication line or the like and stores them in the storage medium 3 or stored in a storage medium provided in other devices. Existing programs and data can be used via a communication line or the like. The input / output peripheral devices such as an input device 5, a display device 6, a printing device 7, and an image scanner 8 are connected to the CPU 1 via a bus line.
Controls their behavior. The input device 5 is a keyboard for inputting character string data and the like and for inputting various commands.
It has a pointing device such as a mouse. Note that the display device 6 is a liquid crystal display device, a CRT display device, a plasma display device, or the like, and the printing device 7 is a non-impact printer such as thermal transfer or ink jet, or a dot impact printer. The image scanner 8 is a stationary scanner that reads a form image by scanning on preprinted paper.

【0007】図2(A)は記憶装置2内の一部を示した
もので、帳票イメージファイル2−1はイメージスキャ
ナ8によって読み取られた帳票イメージを1帳票1ファ
イル形式で記憶するもので、その帳票フォームを設計す
る際に読み出されて設計画面上に表示出力される。帳票
フォームファイル2−2は帳票イメージ表示画面上にお
いて、帳票イメージを背景として帳票フォームが設計さ
れた際に、その帳票フォームを記憶管理するもので、図
3(A)は帳票フォームファイル2−2のデータ構造を
示している。帳票フォームファイル2−2は帳票上の各
項目毎に「割付項目名」、「データ印刷項目」、「文字
列開始位置」、「相対値」を帳票フォーム情報として記
憶管理する構成となっている。ここで、図4に示すよう
に、帳票イメージ表示画面内の項目名印刷領域Aが任意
に選択指定されると、CPU1はその領域内に文字列切
り出し枠Bを割付け、この枠B内からイメージデータを
切り出して文字認識すると共に、この認識文字列に基づ
いて項目名索引テーブル2−3を検索して候補文字列の
絞り込みを行って一覧表示させる。この一覧画面の中か
ら所望の候補文字列が選択されると、その候補文字列は
帳票イメージ上の項目名印刷領域Aに対する項目名とし
て帳票フォームファイル2−2に設定される。このよう
にして設定された項目名が「割付項目名」である。ま
た、「データ印刷項目」は帳票イメージ上において項目
名印刷領域Aに対応付けられているデータ印刷領域Cを
特定するために設定されたもので、その左上座標がデー
タ印刷項目の割付位置(XY座標)として設定され、こ
の割付位置からX方向のサイズがX幅、Y方向のサイズ
がY幅として設定される。この場合、データ印刷領域C
上にはデータ印刷項目を設定するための項目範囲枠Dが
ガイダンス表示され、この項目範囲枠Dの位置および大
きさを任意に変更することによりこの項目範囲枠Dに対
応するデータ印刷項目(割付位置およびサイズ)が設定
される。「文字列開始位置」は文字列切り出し枠Bの左
上座標を示し、また「相対値」は文字列開始位置に対す
る項目割付位置の相対座標値(変化量)である。
FIG. 2A shows a part of the storage device 2. A form image file 2-1 stores a form image read by the image scanner 8 in a form of one form and one file. It is read out when designing the form, and is displayed and output on a design screen. The form form file 2-2 stores and manages the form when the form is designed on the form image display screen with the form image as a background. FIG. 3A shows the form form file 2-2. 3 shows a data structure of the data. The form file 2-2 stores and manages “assignment item name”, “data print item”, “character string start position”, and “relative value” for each item on the form as form form information. . Here, as shown in FIG. 4, when the item name print area A in the form image display screen is arbitrarily selected and designated, the CPU 1 assigns a character string cutout frame B to the area and prints an image from this frame B. The data is cut out and characters are recognized, and the item name index table 2-3 is searched based on the recognized character strings to narrow down the candidate character strings and display a list. When a desired candidate character string is selected from this list screen, the candidate character string is set in the form file 2-2 as an item name for the item name print area A on the form image. The item name set in this way is “assigned item name”. The “data print item” is set to specify the data print area C associated with the item name print area A on the form image, and the upper left coordinate of the data print area is the layout position (XY) of the data print item. The size in the X direction from this allocation position is set as the X width, and the size in the Y direction is set as the Y width. In this case, the data printing area C
On the top, an item range frame D for setting a data print item is displayed as a guidance, and by arbitrarily changing the position and size of the item range frame D, a data print item (allocation) corresponding to the item range frame D is displayed. Position and size) are set. "Character string start position" indicates the upper left coordinate of the character string cutout frame B, and "relative value" indicates the relative coordinate value (change amount) of the item allocation position with respect to the character string start position.

【0008】項目名索引テーブル2−3は帳票イメージ
画面において項目名印刷領域A内の文字列切り出し枠B
から切り出したイメージデータが文字認識された際に、
この認識文字列を項目名に変換するための索引テーブル
である。CPU1はこの項目名索引テーブル2−3を検
索する際に、認識文字列に含まれているキーワードを抽
出し、「金額」、「数量」等のキーワードであれば数値
型項目、「日付」、「年月日」等のキーワードであれば
日時型項目のように認識文字列の種類を判別し、この判
別結果に基づいて種類別索引テーブルを検索する。すな
わち、項目名索引テーブル2−3は図2(B)に示すよ
うに数値型テーブル、日時型テーブル、その他の文字列
型テーブルに区分されており、認識文字列の種類に該当
する種類別テーブルを検索する。ここで、種類別テーブ
ルには類似する各種の項目名が記憶されており、例えば
「代表者」を含む項目名としては「代表者氏名」、「代
表者住所1」、「代表者住所2」……が記憶されてい
る。帳票データファイル2−4は帳票フォームファイル
2−2に設定された帳票フォーム通りに印刷出力される
印刷対象の帳票データをデータ印刷項目毎に記憶するも
ので、図3(B)はこのデータ構造を示している。各印
刷項目はキー入力されたデータが割り当てられる入力項
目あるいは各種の索引テーブルを検索したり、演算処理
によって自動生成されたデータが割り当てられる生成項
目であり、この入力項目あるいは生成項目に対応する帳
票データが帳票データファイル2−4に格納される。文
字認識辞書2−5は文字認識時に参照される通常の辞書
ファイルである。
The item name index table 2-3 has a character string cutout frame B in the item name print area A on the form image screen.
When the image data cut out from
This is an index table for converting this recognition character string into an item name. When searching the item name index table 2-3, the CPU 1 extracts a keyword included in the recognition character string, and if it is a keyword such as "money" or "quantity", a numeric type item, "date", If the keyword is “year / month / day” or the like, the type of the recognized character string is determined as in the case of the date / time type item, and the type-based index table is searched based on the determination result. That is, as shown in FIG. 2B, the item name index table 2-3 is divided into a numeric type table, a date / time type table, and other character string type tables, and a type-specific table corresponding to the type of the recognized character string. Search for. Here, various types of similar item names are stored in the type-specific table. For example, the item names including “representative” include “representative name”, “representative address 1”, and “representative address 2”. ...... is stored. The form data file 2-4 stores form data to be printed, which is printed and output according to the form set in the form form file 2-2, for each data print item. FIG. 3B shows this data structure. Is shown. Each print item is a generated item to which an input item to which key-input data is assigned or various index tables is searched, and data automatically generated by arithmetic processing is assigned, and a form corresponding to the input item or the generated item is assigned. The data is stored in the form data file 2-4. The character recognition dictionary 2-5 is a normal dictionary file that is referred to at the time of character recognition.

【0009】次に、この帳票処理装置の動作を図5〜図
8に示すフローチャートにしたがって説明する。ここ
で、これらのフローチャートに記述されている各機能を
実現するためのプログラムは、読み取り可能なプログラ
ムコードの形態で記憶媒体3に格納されており、CPU
1はこのプログラムコードにしたがった動作を逐次実行
する。図5、図6は帳票フォームを新規登録する際の動
作を示したフローチャートである。図9、図10は帳票
フォームを新規登録する場合の処理過程を具体的に示し
た表示状態で、以下、図9、図10を参照して新規登録
処理を具体的に説明する。先ず、CPU1は帳票イメー
ジファイル2−1から任意に指定した帳票イメージを読
み出して表示出力させる(ステップA1、A2)。この
帳票イメージ表示画面上において帳票イメージをベース
にしてその帳票フォームを設定する場合には、先ず、マ
ウスカーソルを所望の項目名印刷領域A内に移動して領
域指定を行う(ステップA3)。図9(A)はこの場合
の表示状態図で、文字列イメージ「代表者住所」の項目
名印刷領域Aを選択指定した場合である。
Next, the operation of the form processing apparatus will be described with reference to the flow charts shown in FIGS. Here, a program for realizing each function described in these flowcharts is stored in the storage medium 3 in the form of a readable program code.
1 sequentially executes operations according to the program code. FIGS. 5 and 6 are flowcharts showing the operation when newly registering a form. FIG. 9 and FIG. 10 are display states specifically showing processing steps when a form form is newly registered. The new registration processing will be specifically described below with reference to FIG. 9 and FIG. First, the CPU 1 reads a form image arbitrarily designated from the form image file 2-1 and outputs the read form image (steps A1 and A2). When the form is set on the form image display screen based on the form image, first, the mouse cursor is moved to a desired item name print area A to specify the area (step A3). FIG. 9A is a display state diagram in this case, in which the item name printing area A of the character string image “representative address” is selected and designated.

【0010】すると、CPU1は指定された項目名印刷
領域A内を走査し、表示オンドットの集合部分を解析す
ることによって項目名印刷領域A内に存在する文字列範
囲(矩形領域)を特定し、この範囲を文字列切り出し枠
Bとして自動決定し、この枠Bを項目名印刷領域A内の
該当位置に候補表示させる(ステップA4)。図9
(B)はこの場合の表示状態図で、文字列イメージ「代
表者住所」を囲むように文字列切り出し枠Bが候補表示
されるが、文字列切り出し枠Bの表示位置が文字列イメ
ージに対して“ずれ”ている場合にはマウスカーソルに
よってその位置を補正することができるが、文字列切り
出し枠Bの表示位置が正しければ、この確定を指示する
(ステップA5)。すると、図9(B)に示すように確
定された文字列切り出し枠Bの開始位置(矩形の左上隅
部)を検出してその座標値を文字列基準位置としてRA
M4内のワークメモリに記憶保持しておく(ステップA
6)。次に、項目名印刷領域Aに対応するデータ印刷領
域C内に割り付けるデータ印刷項目を特定するための項
目範囲枠Dを文字列開始位置に合わせて候補表示する
(ステップA7)。ここで、項目範囲枠Dは予め決めら
れた大きさの枠で、帳票イメージ上のデータ印刷領域C
とは必ずしも一致するとは限らないが、標準的なデータ
印刷領域Cのサイズに合わせた大きさとなっている。こ
の項目範囲枠Dの左上隅部が文字列切り出し枠Bの開始
位置に合うように、Y座標値を揃えたデータ印刷領域C
内の位置に項目範囲枠Dが候補表示される。
Then, the CPU 1 scans the designated item name print area A and analyzes a set of display ON dots to specify a character string range (rectangular area) existing in the item name print area A. This range is automatically determined as a character string cutout frame B, and this frame B is displayed as a candidate at a corresponding position in the item name print area A (step A4). FIG.
(B) is a display state diagram in this case, in which a character string cutout frame B is candidately displayed so as to surround the character string image "representative address". If the display position of the character string cutout frame B is correct, this determination is instructed (step A5). Then, the start position (upper left corner of the rectangle) of the character string cutout frame B determined as shown in FIG. 9B is detected, and its coordinate value is set as the character string reference position.
It is stored and held in the work memory in M4 (step A
6). Next, an item range frame D for specifying a data print item to be allocated in the data print region C corresponding to the item name print region A is displayed as a candidate according to the character string start position (step A7). Here, the item range frame D is a frame of a predetermined size, and the data print area C on the form image is displayed.
Does not always coincide with the size, but has a size corresponding to the size of the standard data print area C. A data print area C in which the Y coordinate values are aligned so that the upper left corner of the item range frame D matches the start position of the character string cutout frame B.
The item range frame D is displayed as a candidate at a position inside the box.

【0011】また文字列切り出し枠Bが確定されると、
この文字列切り出し枠B内のイメージデータを切り出
し、このイメージデータに基づいて文字認識辞書2−5
を検索し、1文字毎に文字コードに変換する文字認識処
理を行う(ステップA8)。これによって文字列イメー
ジに対応する認識文字列が得られると、その文字列内に
所定のキーワードが含まれているかを判断し、所定のキ
ーワードが含まれていれば、そのキーワードに応じた種
類の項目名索引テーブル2−3を検索する(ステップA
9、A10)。ここで、認識文字列内に「金額」、「数
量」等のキーワードが有れば数値型の項目、「日付」、
「年月日」等のキーワードが有れば日時型項目と判断す
るが、所定のキーワードが含まれていなければ、その他
の文字列項目と判断する。そして、この項目種別と認識
文字列とに基づいて種類別項目名索引テーブル2−3を
検索する。この結果、認識文字列と同一名称の項目名が
有れば(図6のステップA11)、それを候補表示する
(ステップA12)。ここで、当該候補を割付項目名と
して決定する場合にはその確定を指示する(ステップA
13)。いま、図9(C)に示すように文字列イメージ
「代表者住所」が「代表者氏名」に文字認識された場
合、この認識文字列と同一名称の項目名は項目名索引テ
ーブル2−3内に存在するため、その項目名が候補表示
される。この項目名はイメージ内容と相違するため、次
候補表示を指示すると(ステップA13)、認識文字列
に類似するその他の項目名が項目名索引テーブル2−3
から検索されて候補ウインドウ内に一覧表示される(ス
テップA14)。図10(D)はこの場合の表示状態を
示し、その中から該当候補をマウスカーソルによって選
択指定し、その選択候補を割付項目名として決定するた
めにその確定を指示する(ステップA15)。なお、こ
の一覧表示の中に該当する項目名が無ければ、キーボー
ドから文字列を直接入力する(ステップA16)。
When the character string cutout frame B is determined,
Image data in the character string cutout frame B is cut out, and a character recognition dictionary 2-5 is extracted based on the image data.
, And performs a character recognition process of converting each character into a character code (step A8). As a result, when a recognized character string corresponding to the character string image is obtained, it is determined whether or not a predetermined keyword is included in the character string, and if the predetermined keyword is included, a type corresponding to the keyword is determined. Search the item name index table 2-3 (Step A)
9, A10). Here, if there are keywords such as “amount” and “quantity” in the recognition character string, numeric items, “date”,
If there is a keyword such as "year / month / day", it is determined to be a date / time type item, but if it does not contain a predetermined keyword, it is determined to be another character string item. Then, the type-specific item name index table 2-3 is searched based on the item type and the recognition character string. As a result, if there is an item name having the same name as the recognized character string (step A11 in FIG. 6), it is displayed as a candidate (step A12). Here, when the candidate is determined as the allocation item name, the determination is instructed (step A).
13). Now, as shown in FIG. 9C, when the character string image "representative address" is recognized as "representative name", the item name having the same name as the recognized character string is the item name index table 2-3. , The item name is displayed as a candidate. Since this item name is different from the image content, when the next candidate display is instructed (step A13), other item names similar to the recognized character string are displayed in the item name index table 2-3.
And a list is displayed in the candidate window (step A14). FIG. 10D shows a display state in this case, in which a corresponding candidate is selected and designated by a mouse cursor, and the determination is instructed to determine the selected candidate as an allocation item name (step A15). If there is no corresponding item name in this list display, a character string is directly input from the keyboard (step A16).

【0012】このようにして確定あるいは入力された項
目名は、文字列切り出し枠B内に識別表示される(ステ
ップA17)。すなわち、帳票イメージ上の未設定領域
と区別するためにカラー表示や点滅表示によって当該領
域を識別表示する。そして、次のステップA18ではデ
ータ印刷領域C内において文字列切り出し枠Bの位置お
よびサイズをマウスのドラッグ操作によって微調整し、
データ印刷項目を特定する(図10(E)参照)。する
と、この文字列切り出し枠Bに基づいてデータ印刷項目
の割付位置(矩形枠の左上隅部)とその横・縦サイズと
を検出すると共に(ステップA19)、文字列切り出し
枠Bの開始位置とデータ印刷項目の割付位置とに基づい
てそれらの相対値(変化量)を算出する(ステップA2
0)。そして、割付項目名、データ印刷項目の割付位置
およびサイズ、文字列開始位置、相対値を1レコード分
のデータとして帳票フォームファイル2−2に設定登録
する(ステップA21)。図10(F)は帳票フォーム
ファイル2−2に設定される各種のパラメータを示して
いる。このようにして帳票イメージ上の1項目分の登録
処理が終ると、ステップA22で全項目終了かを調べ、
終了するまで図5のステップA3に戻り、次の項目名印
刷領域Aが選択指定される毎に上述の動作が繰り返され
る。
The item name thus determined or input is identified and displayed in the character string cutout frame B (step A17). That is, the area is identified and displayed by color display or blinking display to distinguish it from the unset area on the form image. In the next step A18, the position and size of the character string cutout frame B in the data print area C are finely adjusted by dragging the mouse.
The data print item is specified (see FIG. 10E). Then, based on the character string cutout frame B, the allocation position of the data print item (the upper left corner of the rectangular frame) and its horizontal and vertical sizes are detected (step A19), and the start position of the character string cutout frame B is determined. Based on the allocation positions of the data print items, their relative values (change amounts) are calculated (step A2).
0). Then, the assignment item name, the assignment position and size of the data print item, the character string start position, and the relative value are set and registered in the form file 2-2 as data for one record (step A21). FIG. 10F shows various parameters set in the form file 2-2. When the registration process for one item on the form image is completed in this way, it is checked in step A22 whether all items have been completed.
Until the process is completed, the process returns to step A3 of FIG.

【0013】次に、上述のようにして帳票フォームを新
規登録した後において、その帳票の出力形式が変更され
た場合には、帳票フォーム変更処理を行う。図7、図8
はこの帳票フォーム変更処理を示したフローチャートで
ある。また図11はこの変更処理を具体的に説明するた
めの表示状態図であり、(A)は変更前の帳票フォー
ム、(B)は変更後の帳票フォームを示している。先
ず、変更後の帳票がイメージスキャナ8によって読み取
られて帳票イメージファイル2−1に登録されている状
態において、その変更後の帳票イメージが指定される
と、CPU1はそれを読み出して表示出力させる(ステ
ップB1)。すると、この表示イメージ上の項目名印刷
領域Aをその先頭から着目し、その着目領域を抽出する
と共に(ステップB2)、抽出した項目名印刷領域A内
を走査して表示オンドットの集合部分を解析し、それに
応じて文字列切り出し枠Bを自動決定し、その項目名印
刷領域A内に候補表示する(ステップB3)。ここで、
文字列切り出し枠Bの確定が指示されると、その文字列
切り出し枠Bの開始位置を検出して記憶保持しておくと
共に(ステップB4)、文字列切り出し枠B内のイメー
ジデータを切り出して文字認識を行う(ステップB
5)。そして、帳票フォームファイル2−2から着目領
域(最初は先頭領域)に対応する割付項目名を読み出す
(ステップB6)。この割付項目名は変更前の登録済み
項目名であり、この割付項目名と文字認識された変更後
の項目名とを比較する(ステップB7)。この結果、項
目名の一致が検出された場合には当該項目のフォーム情
報は変更されていないと判断するが、項目名の不一致が
検出されると、その項目のフォーム情報を自動変更する
処理に移行する(ステップB9〜B16)。
Next, after the form is newly registered as described above, if the output format of the form is changed, a form change process is performed. 7 and 8
Is a flowchart showing this form change process. FIGS. 11A and 11B are display state diagrams for specifically explaining the change processing. FIG. 11A shows a form before change, and FIG. 11B shows a form after change. First, in a state where the changed form is read by the image scanner 8 and registered in the form image file 2-1, if the changed form image is designated, the CPU 1 reads it out and causes it to be displayed and output ( Step B1). Then, the item name printing area A on the display image is focused on from the top, the focused area is extracted (step B2), and the extracted item name printing area A is scanned to display the set of display on dots. The character string cutout frame B is automatically determined in accordance with the analysis, and candidates are displayed in the item name print area A (step B3). here,
When the determination of the character string cutout frame B is instructed, the start position of the character string cutout frame B is detected and stored (step B4), and the image data in the character string cutout frame B is cut out to obtain a character. Perform recognition (Step B)
5). Then, the allocation item name corresponding to the area of interest (the first area) is read from the form file 2-2 (step B6). The assigned item name is the registered item name before the change, and the assigned item name is compared with the changed item name after character recognition (step B7). As a result, when a match of the item name is detected, it is determined that the form information of the item has not been changed. However, when a mismatch of the item name is detected, the processing for automatically changing the form information of the item is performed. The process proceeds (steps B9 to B16).

【0014】いま、図11(B)に示す変更後の帳票イ
メージ上において、その3番目の項目名印刷領域Aを着
目し、その認識文字列が「代表者住所」である場合、こ
の着目領域に対応する変更前の項目名は図11(A)に
示すように「代表者氏名」であるため、両者の不一致が
検出される。すると、この変更前後の項目名を対応付け
たウインドウを表示させ(ステップB9)、割付変更の
指示待ちとなる(ステップB10)。この項目名対応ウ
インドウは図11(B)に示すように変更後の帳票イメ
ージ上に表示され、オペレータはこの表示内容を確認し
たのち、割付変更を指示すると、CPU1は帳票フォー
ムファイル2−2内の変更前の割付項目名、文字列開始
位置を変更後の項目名、文字列開始位置に書き替えるフ
ォーム変更処理を行うと共に(ステップB11)、表示
イメージ上の文字列切り出し枠B内に変更後の項目名を
識別表示する(ステップB12)。この場合の識別表示
もカラー表示や点滅表示によって行われ、これによって
変更箇所が明示される。
Now, focusing on the third item name printing area A on the changed form image shown in FIG. 11B, if the recognized character string is “representative address,” Since the item name before the change corresponding to is "representative name" as shown in FIG. 11A, a mismatch between the two is detected. Then, a window in which the item names before and after the change are associated is displayed (step B9), and an instruction to change the assignment is waited for (step B10). This item name corresponding window is displayed on the changed form image as shown in FIG. 11 (B). After the operator confirms the displayed contents and instructs to change the allocation, the CPU 1 stores the form form file 2-2 in the form form file 2-2. Form change processing for rewriting the assigned item name and character string start position before the change to the item name and character string start position after the change (step B11) and after changing the character string cutout frame B on the display image Are identified and displayed (step B12). In this case, the identification display is also performed by color display or blinking display, thereby clearly indicating a changed portion.

【0015】次に、変更後における文字列開始位置と、
この文字列と同一名称である該当項目名に対応する変更
前の割付位置とを読み出してそれらの相対値を算出する
(ステップB13、B14)。すなわち、図11(C)
に示すように変更後の文字列開始位置は「代表者住所」
の開始位置であり、この項目名に基づいて帳票フォーム
ファイル2−2を検索し(ステップB13)、それと同
一名称である該当項目名「代表者住所」に対応するデー
タ印刷項目の割付位置を変更前の割付位置として読み出
し、この変更後の文字列開始位置と変更前の割付位置と
に基づいてそれらの相対値を算出する(ステップB1
4)。更に、変更後の項目名に基づいてそれと同一名称
である該当項目名に対応する相対値を帳票フォームファ
イル2−2から検索し(ステップB15)、算出された
変更後の相対値と検索された変更前の相対値とを比較し
てその差分を算出する(ステップB16)。そして、こ
の差分値に基づいて変更後の割付位置を算出すると共に
(ステップB17)、帳票フォームファイル2−2内の
変更前の割付位置を変更後の割付位置に書き替えるフォ
ーム変更処理を行う(ステップB18)。図11(C)
は変更前後の割付位置を示し、変更後の割付位置は変更
前に対して1項目上に移動したものとなる。このような
フォーム変更処理はステップB19で全項目終了が検出
されるまでステップB2に戻り、1項目分に繰り返され
る。図12はこのフォーム変更処理の実行前後における
帳票フォームファイル2−2の内容を示し、(A)は変
更前、(B)は変更後を示している。
Next, the character string starting position after the change,
This character string and the assigned position before the change corresponding to the corresponding item name having the same name are read out, and their relative values are calculated (steps B13 and B14). That is, FIG.
The starting position of the character string after the change is "representative address" as shown in
The form form file 2-2 is searched based on this item name (step B13), and the layout position of the data print item corresponding to the corresponding item name "representative address" having the same name is changed. It is read out as the previous allocation position, and based on the character string start position after the change and the allocation position before the change, their relative values are calculated (step B1).
4). Further, based on the changed item name, a relative value corresponding to the corresponding item name having the same name is searched from the form file 2-2 (step B15), and the calculated relative value is searched. The difference is calculated by comparing the relative value before the change (step B16). Then, based on this difference value, the post-change allocation position is calculated (step B17), and a form change process is performed to rewrite the pre-change allocation position in the form file 2-2 with the post-change allocation position (step B17). Step B18). FIG. 11 (C)
Indicates the assignment position before and after the change, and the assignment position after the change is one position higher than that before the change. Such form change processing returns to step B2 until the end of all items is detected in step B19, and is repeated for one item. FIGS. 12A and 12B show the contents of the form file 2-2 before and after the execution of the form change process, wherein FIG. 12A shows the state before the change and FIG. 12B shows the state after the change.

【0016】以上のように帳票フォームを新規登録する
際には、帳票イメージ画面上の項目名印刷領域Aからイ
メージデータを切り出して文字認識すると共に、文字認
識された文字列に基づいて項目名索引テーブル2−3を
検索し、その検索結果を候補表示させ、その中から所望
の候補文字列が選択されると、その候補文字列を帳票イ
メージ上の項目名印刷領域Aに対応する帳票フォーム情
報として帳票フォームファイル2−2に新規登録するよ
うにしたから、項目名の設定を容易に行うことができ
る。すなわち、候補表示される内容は文字認識された文
字列と同一あるいは類似する項目名のみに絞り込まれる
ので、その候補数は限定されたものとなり、しかも印刷
された活字体を文字認識したものであれば、それだけ認
識率が高くなり、同一項目名が直ちに候補表示されるの
で、候補の中から所望する項目名を選択する場合に、そ
の選択が容易なものとなる。この場合、帳票イメージ画
面上の各項目名印刷領域Aの中から任意の項目名印刷領
域Aを指定しながら1項目毎に項目名を設定することが
できるので、所望する項目名のみを選択的に設定するこ
とが可能となり、帳票フォームを自由に設定することが
できる。また、項目名索引テーブル2−3を検索する際
に文字認識された文字列内に含まれているキーワードを
判別し、その判別結果に応じてそれに対応する種類の種
類別テーブルを優先的に検索するようにしたから、その
検索を効率良く行うことが可能となる。更に、項目名印
刷領域Aに対応するデータ印刷項目を特定するための項
目範囲枠Dをガイダンス表示させ、その項目範囲枠Dの
大きさ、位置を微調整することによってデータ印刷項目
を決定し、その割付位置およびサイズを帳票フォーム情
報として設定することができるので、項目名と共にそれ
に対応するデータ印刷項目の設定も容易に行うことが可
能となる。
As described above, when a form is newly registered, image data is cut out from the item name print area A on the form image screen and characters are recognized, and an item name index is created based on the recognized character string. The table 2-3 is searched, and the search result is displayed as a candidate. When a desired candidate character string is selected from the search result, the candidate character string is stored in the form image information corresponding to the item name print area A on the form image. Is newly registered in the form file 2-2, setting of the item name can be easily performed. In other words, the contents displayed as candidates are narrowed down to only the item names that are the same or similar to the character strings recognized as characters, so the number of candidates is limited, and even if the printed typeface is recognized as characters. As a result, the recognition rate becomes higher, and the same item name is immediately displayed as a candidate. Therefore, when a desired item name is selected from the candidates, the selection becomes easy. In this case, it is possible to set an item name for each item while designating an arbitrary item name printing area A from among the item name printing areas A on the form image screen. Can be set, and the form can be set freely. In addition, when searching the item name index table 2-3, a keyword included in a character string that is recognized as a character is determined, and a type table corresponding to the keyword is preferentially searched according to the determination result. The search can be performed efficiently. Further, an item range frame D for specifying the data print item corresponding to the item name print area A is displayed for guidance, and the size and position of the item range frame D are finely adjusted to determine the data print item. Since the allocation position and size can be set as the form information, it is possible to easily set not only the item name but also the corresponding data print item.

【0017】また、帳票フォームを変更登録する際に
は、帳票フォームファイル2−2内には、帳票の出力形
式を定義する各項目毎に項目割付位置と、項目内の文字
列と、この文字列の基準位置と項目割付位置との相対値
とが帳票フォーム情報として設定されているので、帳票
の出力形式が変更された際には、帳票フォームファイル
2−2の内容に基づいて帳票フォームを自動修正するこ
とができる。すなわち、帳票イメージ上の項目名印刷領
域Aからイメージデータを切り出して文字認識すると共
に、この認識文字列と変更前の文字列との不一致が検出
された際に、変更後の文字列の基準位置を検出し、この
基準位置と変更前の項目割付位置とに基づいてそれらの
変化量を算出し、この変化量と変更前の相対値とに基づ
いて変更後の項目割付位置を算出し、この算出値に基づ
いて変更前の項目割付位置を修正することができる。こ
の場合、変更前の項目名を変更後の項目名に修正するこ
ともできる。更に、変更後の項目名が誤認識されたもの
であっても、変更前後の項目名が対応表示されるので、
オペレータはそれを確認することができ、その結果、割
付変更の指示があった場合に、帳票フォームの自動修正
が行われるので、誤認識された項目名による間違った修
正を未然に防止することが可能となる。
When the form is changed and registered, the form form file 2-2 includes an item allocation position for each item defining the form output format, a character string in the item, and a character string. Since the relative value between the reference position of the column and the item allocation position is set as the form information, when the output format of the form is changed, the form is created based on the contents of the form file 2-2. Can be automatically corrected. That is, the image data is cut out from the item name print area A on the form image and characters are recognized. When a mismatch between the recognized character string and the character string before change is detected, the reference position of the character string after change is detected. Is calculated based on the reference position and the item allocation position before the change, and the changed item allocation position is calculated based on the change amount and the relative value before the change. The item allocation position before the change can be corrected based on the calculated value. In this case, the item name before the change can be corrected to the item name after the change. Furthermore, even if the item name after the change is incorrectly recognized, the item name before and after the change is displayed correspondingly,
The operator can confirm it, and as a result, when there is an instruction to change the assignment, the form is automatically corrected, so that it is possible to prevent erroneous correction due to misrecognized item names beforehand. It becomes possible.

【0018】なお、帳票イメージ上においてその明細領
域内の各項目に限らず、そのヘッダー領域や集計領域に
対応する各項目のフォーム情報を設定するようにしても
よい。また、帳票イメージ上の項目名印刷領域Aを指定
する際にマウスカーソルによって行うようにしたが、マ
ウスに限らず、キーや入力ペン等の入力手段によって指
定するようにしてもよい。
It should be noted that the form information of each item corresponding to the header area and the total area may be set on the form image, not limited to each item in the detailed area. Although the item name print area A on the form image is designated by the mouse cursor, the designation is not limited to the mouse but may be designated by an input means such as a key or an input pen.

【0019】[0019]

【発明の効果】第1の発明によれば、帳票イメージをベ
ースにしてその帳票フォームを設定する際に、帳票イメ
ージ上の文字列を文字認識することで、項目名等の文字
列を容易に設定することができる。第2の発明によれ
ば、帳票イメージをベースにしてその帳票フォームを設
計した後において、その帳票の出力形式が変更された場
合であっても、変更後の帳票イメージを解析した解析結
果と変更前の帳票フォーム情報とに基づいて帳票フォー
ムを自動的に修正することができる。
According to the first aspect of the present invention, when setting a form based on a form image, character strings on the form image are recognized by characters, so that a character string such as an item name can be easily formed. Can be set. According to the second invention, after designing the form based on the form image, even if the output format of the form is changed, the analysis result obtained by analyzing the changed form image and the change The form can be automatically corrected based on the previous form information.

【図面の簡単な説明】[Brief description of the drawings]

【図1】帳票処理装置の全体構成を示したブロック図。FIG. 1 is a block diagram showing an overall configuration of a form processing apparatus.

【図2】(A)は記憶装置2内の一部を示した図、
(B)は項目名索引テーブル2−3の構成を説明するた
めの図。
FIG. 2A is a diagram showing a part of a storage device 2;
(B) is a diagram for explaining the configuration of the item name index table 2-3.

【図3】(A)は帳票フォームファイル2−2の構成を
説明するための図、(B)は帳票データファイル2−4
の構成を説明するための図。
FIG. 3A is a diagram for explaining the configuration of a form file 2-2, and FIG. 3B is a form data file 2-4;
The figure for demonstrating the structure of.

【図4】帳票イメージ画面を説明するための図。FIG. 4 is a view for explaining a form image screen.

【図5】帳票フォーム新規登録処理の一部を示したフロ
ーチャート。
FIG. 5 is a flowchart showing a part of a form registration process;

【図6】図5に続く帳票フォーム新規登録処理の一部を
示したフローチャート。
FIG. 6 is a flowchart showing a part of a form form new registration process following FIG. 5;

【図7】帳票フォーム変更処理の一部を示したフローチ
ャート。
FIG. 7 is a flowchart showing a part of a form change process;

【図8】図7に続く帳票フォーム変更登録処理の一部を
示したフローチャート。
FIG. 8 is a flowchart showing a part of a form change registration process following FIG. 7;

【図9】(A)〜(C)は帳票フォーム新規登録時の処
理過程を示した表示状態図。
FIGS. 9A to 9C are display state diagrams showing processing steps when a form form is newly registered.

【図10】(D)〜(E)は図9に続く処理過程を示し
た表示状態図。
10 (D) to 10 (E) are display state diagrams showing the processing steps following FIG. 9;

【図11】(A)〜(C)は帳票フォーム変更登録時の
処理過程を示した表示状態図。
FIGS. 11A to 11C are display state diagrams showing processing steps at the time of registering a form change;

【図12】帳票フォームの変更前後における帳票フォー
ムファイル2−2の内容を示し、(A)は変更前、
(B)は変更後の内容を示した図。
FIG. 12 shows the contents of a form file before and after the change of the form, and FIG.
(B) is a diagram showing the contents after the change.

【符号の説明】[Explanation of symbols]

1 CPU 2 記憶装置 2−1 帳票イメージファイル 2−2 帳票フォームファイル 2−3 項目名索引テーブル 2−4 帳票データファイル 2−5 文字認識辞書 3 記憶媒体 4 RAM 5 入力装置 6 表示装置 7 印刷装置 8 イメージスキャナ A 項目名印刷領域 B 文字列切り出し枠 C データ印刷領域 D 項目範囲枠 DESCRIPTION OF SYMBOLS 1 CPU 2 Storage device 2-1 Form image file 2-2 Form form file 2-3 Item name index table 2-4 Form data file 2-5 Character recognition dictionary 3 Storage medium 4 RAM 5 Input device 6 Display device 7 Printing device 8 Image scanner A Item name print area B Character string cutout frame C Data print area D Item range frame

Claims (11)

【特許請求の範囲】[Claims] 【請求項1】所望する帳票フォームを設計する際に、予
め読み取られた帳票イメージを表示出力させると共に、
この帳票イメージ画面を背景としてその帳票の出力フォ
ームを設定する帳票処理装置において、 帳票イメージ画面上の文字列領域内からイメージデータ
を切り出して文字認識を行う文字認識手段と、 この文字列認識手段によって文字認識された文字列に基
づいて文字列候補索引テーブルを検索し、その検索結果
を候補表示する候補文字列変換手段と、 前記候補表示されている文字列の中から所望の候補文字
列が選択された際に、その選択候補文字列を帳票イメー
ジ上の前記文字列領域に対応する帳票フォーム情報とし
て設定するフォーム情報設定手段とを具備したことを特
徴とする帳票処理装置。
When designing a desired form, a form image read in advance is displayed and output.
In a form processing apparatus for setting an output form of the form with the form image screen as a background, character recognition means for cutting out image data from a character string area on the form image screen and performing character recognition; A character string candidate index table that is searched based on the character string that has been recognized, and a candidate character string conversion unit that displays the search result as a candidate; and a desired candidate character string is selected from the candidate displayed character strings. And a form information setting unit for setting the selected candidate character string as form form information corresponding to the character string area on the form image when the selection is made.
【請求項2】帳票イメージ画面上の各種の文字列領域の
うち所望する文字列領域を任意に指定する領域指定手段
を設け、 前記文字認識手段は前記領域指定手段によって指定され
た文字列領域内からイメージデータを切り出して文字認
識を行うようにしたことを特徴とする請求項1記載の帳
票処理装置。
2. An image processing apparatus according to claim 1, further comprising an area designating means for arbitrarily designating a desired character string area among various character string areas on the form image screen, wherein said character recognizing means comprises a character string area designated by said area designating means. 2. The form processing apparatus according to claim 1, wherein character recognition is performed by extracting image data from the document.
【請求項3】前記候補文字列変換は、前記文字認識手段
によって文字認識された文字列に基づいてその種類を判
別すると共にその判別結果に基づいて種類別文字列候補
索引テーブルを種類毎に検索するようにしたことを特徴
とする請求項1記載の帳票処理装置。
3. The candidate character string conversion includes determining a type of the character string based on the character string recognized by the character recognition unit, and searching a type-specific character string candidate index table for each type based on a result of the determination. 2. The form processing apparatus according to claim 1, wherein the form processing is performed.
【請求項4】帳票イメージ上の文字列領域に対応付けら
れているデータ印刷用の印刷対象領域を特定するための
範囲枠を帳票イメージ画面上にガイダンス表示する表示
制御手段と、 前記範囲枠の位置/大きさを帳票イメージ画面上で編集
する編集手段とを設け、 前記フォーム情報設定手段は前記編集手段によって編集
された範囲枠に基づいて印刷対象項目を決定し、この印
刷対象項目を帳票フォーム情報として設定するようにし
たことを特徴とする請求項1記載の帳票処理装置。
4. A display control means for providing guidance on a form image screen for specifying a range frame for specifying a print target area for data printing associated with a character string area on the form image; Editing means for editing the position / size on a form image screen, wherein the form information setting means determines a print target item based on the range frame edited by the edit means, and converts the print target item into a form form. 2. The form processing device according to claim 1, wherein the form is set as information.
【請求項5】帳票の出力形式が変更された際に、変更後
の帳票イメージ上の文字列領域内からイメージデータを
切り出して文字認識すると共に、文字認識された文字列
と前記フォーム情報設定手段によって設定された変更前
の文字列とを比較し、両者の不一致が検出された場合
に、変更前の設定文字列を変更後の認識文字列に書き替
えるようにしたことを特徴とする請求項1記載の帳票処
理装置。
5. When a form output format is changed, image data is cut out from a character string area on the changed form image and characters are recognized, and the character string and the form information setting means are recognized. And comparing the set character string before the change with the recognized character string after the change when a mismatch between the two is detected. 1. The form processing device according to 1.
【請求項6】所望する帳票フォームを設計する際に、予
め読み取られた帳票イメージを表示出力させると共に、
この帳票イメージ画面を背景としてその帳票の出力フォ
ームを設定する帳票処理装置において、 帳票の出力形式を定義する各項目毎に項目割付位置と、
項目内の文字列と、この文字列の基準位置と項目割付位
置との相対値とを帳票フォーム情報として記憶するフォ
ーム情報記憶手段と、 帳票の出力形式が変更された際に、変更後の帳票イメー
ジ上の文字列領域内からイメージデータを切り出して文
字認識する文字認識手段と、 この文字認識手段によって文字認識された文字列と前記
フォーム情報記憶手段内の変更前の文字列とを比較し、
両者の不一致が検出された際に、変更後の文字列基準位
置を検出する位置検出手段と、 この位置検出手段によって検出された文字列基準位置と
前記フォーム情報記憶手段内の項目割付位置とに基づい
てそれらの変化量を算出すると共に、この変化量と前記
フォーム情報記憶手段内の相対値とに基づいて変更後の
項目割付位置を算出する算出手段と、 この算出手段によって求められた項目割付位置に基づい
て前記フォーム情報記憶手段内の項目割付位置を修正す
る修正手段とを具備したことを特徴とする帳票処理装
置。
6. Designing a desired form, displaying and outputting a form image read in advance,
In a form processing device for setting an output form of the form with the form image screen as a background, an item allocation position for each item defining an output form of the form,
Form information storage means for storing the character string in the item and the relative value between the reference position of this character string and the item allocation position as the form information, and the form after the change when the form output format is changed A character recognition unit that cuts out image data from within a character string area on the image and recognizes characters, and compares a character string recognized by the character recognition unit with a character string before change in the form information storage unit.
Position detecting means for detecting a changed character string reference position when a mismatch between the two is detected; and a character string reference position detected by the position detecting means and an item allocation position in the form information storage means. Calculating means for calculating the change amount based on the change amount, and calculating the changed item allocation position based on the change amount and the relative value in the form information storage means; and the item allocation obtained by the calculation means. A form processing device comprising: a correction unit configured to correct an item allocation position in the form information storage unit based on the position.
【請求項7】前記位置検出手段によって変更前後の文字
列の不一致が検出された際に、前記修正手段は変更前の
項目割付位置を変更後の項目割付位置に書き替える他、
変更前の文字列を変更後の文字列に書き替えるようにし
たことを特徴とする請求項6記載の帳票処理装置。
7. When the position detecting means detects a mismatch between the character strings before and after the change, the correcting means rewrites the item allocation position before the change to the item allocation position after the change.
7. The form processing apparatus according to claim 6, wherein the character string before the change is rewritten with the character string after the change.
【請求項8】前記位置検出手段によって変更前後の文字
列の不一致が検出された際に、変更前後の文字列を対応
表示させ、割付変更が指示された際に、前記修正手段は
帳票フォーム情報の修正を行うようにしたことを特徴と
する請求項6あるいは7記載の帳票処理装置。
8. When the position detecting means detects a mismatch between the character strings before and after the change, the character strings before and after the change are displayed correspondingly, and when the assignment change is instructed, the correcting means uses the form information. 8. The form processing device according to claim 6, wherein the correction is made.
【請求項9】前記文字認識手段は帳票イメージ上の文字
列領域内からイメージデータを切り出す際に、データが
集合している集合部分を切り出し枠として決定し、この
切り出し枠内のイメージデータを抽出して文字認識し、 前記位置検出手段は前記切り出し枠の所定位置を文字列
基準位置として検出するようにしたことを特徴とする請
求項6あるいは7記載の帳票処理装置。
9. The character recognizing means, when cutting out image data from a character string area on a form image, determines a set portion where the data is set as a cutout frame, and extracts the image data in the cutout frame. 8. The form processing apparatus according to claim 6, wherein the position detection unit detects a predetermined position of the cutout frame as a character string reference position.
【請求項10】コンピュータによって読み取られるプロ
グラムコードを有する記録媒体であって、 帳票イメージ画面上の文字列領域内からイメージデータ
を切り出して文字認識を行う機能と、 文字認識された文字列に基づいて文字列候補索引テーブ
ルを検索し、その検索結果を候補表示する機能と、 前記候補表示されている文字列の中から所望の候補文字
列が選択された際に、その選択候補文字列を帳票イメー
ジ上の前記文字列領域に対応する帳票フォーム情報とし
て設定する機能を実現するためのプログラムコードを有
する記録媒体。
10. A recording medium having a program code read by a computer, comprising: a function of cutting out image data from a character string area on a form image screen to perform character recognition; A function of searching a character string candidate index table and displaying the search result as a candidate; and when a desired candidate character string is selected from the character strings displayed as candidates, the selected candidate character string is converted to a form image. A recording medium having a program code for realizing a function of setting as the form information corresponding to the above character string area.
【請求項11】コンピュータによって読み取られるプロ
グラムコードを有する記録媒体であって、 帳票の出力形式を定義する各項目毎に項目割付位置と、
項目内の文字列と、この文字列の基準位置と項目割付位
置との相対値とを帳票フォーム情報として記憶管理する
機能と、 帳票の出力形式が変更された際に、変更後の帳票イメー
ジ上の文字列領域内からイメージデータを切り出して文
字認識する機能と、 文字認識された文字列と前記フォーム情報記憶手段内の
変更前の文字列とを比較し、両者の不一致が検出された
際に、変更後の文字列基準位置を検出する機能と、 検出された文字列基準位置と前記フォーム情報記憶手段
内の項目割付位置とに基づいてそれらの変化量を算出す
ると共に、この変化量と前記フォーム情報記憶手段内の
相対値とに基づいて変更後の項目割付位置を算出する機
能と、 算出された項目割付位置に基づいて前記フォーム情報記
憶手段内の項目割付位置を修正する機能を実現するため
のプログラムコードを有する記録媒体。
11. A recording medium having a program code read by a computer, comprising: an item allocation position for each item defining an output format of a form;
A function for storing and managing the character string in the item and the relative value between the reference position of this character string and the item allocation position as form information, and when the output format of the form is changed, the changed form image The function of recognizing characters by cutting out image data from the character string area of the character string area is compared with the character string recognized by the character and the character string before change in the form information storage means. When a mismatch between the two is detected, A function for detecting the character string reference position after the change, and calculating the amount of change based on the detected character string reference position and the item allocation position in the form information storage means. A function for calculating the changed item allocation position based on the relative value in the form information storage means, and a function for correcting the item allocation position in the form information storage means based on the calculated item allocation position Recording medium having a program code for implementing the above.
JP11067636A 1999-03-15 1999-03-15 Document processor and program recording medium therefor Pending JP2000268106A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11067636A JP2000268106A (en) 1999-03-15 1999-03-15 Document processor and program recording medium therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11067636A JP2000268106A (en) 1999-03-15 1999-03-15 Document processor and program recording medium therefor

Publications (1)

Publication Number Publication Date
JP2000268106A true JP2000268106A (en) 2000-09-29

Family

ID=13350691

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11067636A Pending JP2000268106A (en) 1999-03-15 1999-03-15 Document processor and program recording medium therefor

Country Status (1)

Country Link
JP (1) JP2000268106A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010510563A (en) * 2006-11-16 2010-04-02 インターナショナル・ビジネス・マシーンズ・コーポレーション Automatic generation of form definitions from hardcopy forms
US8564846B2 (en) 2010-09-13 2013-10-22 Ricoh Company, Ltd. Form processing apparatus, form processing method, and storage medium for updating definition data

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010510563A (en) * 2006-11-16 2010-04-02 インターナショナル・ビジネス・マシーンズ・コーポレーション Automatic generation of form definitions from hardcopy forms
US8564846B2 (en) 2010-09-13 2013-10-22 Ricoh Company, Ltd. Form processing apparatus, form processing method, and storage medium for updating definition data

Similar Documents

Publication Publication Date Title
JP4356847B2 (en) Field definition information generation method, line and field definition information generation device
KR19980080989A (en) Handwriting Data Input Device with Coordinate Detection Tablet
JPH07200786A (en) Filing device
US20090049375A1 (en) Selective processing of information from a digital copy of a document for data entry
JP2008059157A (en) Document confirmation support system, document confirmation support device and program
EP1256900A1 (en) Database entry system and method employing optical character recognition
JPH07210577A (en) Information access device
JP2007323474A (en) Ocr system, ocr format parameter preparation method, its program and program recording medium
JP2000322417A (en) Device and method for filing image and storage medium
JP2000268106A (en) Document processor and program recording medium therefor
JP6190549B1 (en) Document processing system
JP2020190843A (en) Document conversion device
JP2021047688A (en) Form recognition method and program
JP2009151676A (en) Data processor, data processing method, and program
US11481544B2 (en) Form processing apparatus and non-transitory computer readable medium
JP2003132078A (en) Database construction device, method therefor, program thereof and recording medium
JP6960646B1 (en) Reading system, reading program and reading method
JPH0728801A (en) Image data processing method and device therefor
JP5039505B2 (en) Document search apparatus and document search support method
JP4130429B2 (en) Character reader
JPH11316792A (en) Information processor and slip creating method
JP4462508B2 (en) Information processing apparatus and definition information generation method
JP2682873B2 (en) Recognition device for tabular documents
JP2000163271A (en) Method and apparatus for information processing
JP4774876B2 (en) Data input device and program

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051011

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051220

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20060206

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20060221

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060307