JPS6214278A - Information processing system - Google Patents

Information processing system

Info

Publication number
JPS6214278A
JPS6214278A JP60152209A JP15220985A JPS6214278A JP S6214278 A JPS6214278 A JP S6214278A JP 60152209 A JP60152209 A JP 60152209A JP 15220985 A JP15220985 A JP 15220985A JP S6214278 A JPS6214278 A JP S6214278A
Authority
JP
Japan
Prior art keywords
ocr
parameters
data
information processing
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP60152209A
Other languages
Japanese (ja)
Other versions
JPH07107695B2 (en
Inventor
Hiromichi Fujisawa
藤澤 浩通
Yasuaki Nakano
中野 康明
Toshihiro Hananoi
花野井 歳弘
Masao Michino
道野 正雄
Kiyomichi Kurino
栗野 清道
Osamu Kunisaki
国崎 修
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP60152209A priority Critical patent/JPH07107695B2/en
Publication of JPS6214278A publication Critical patent/JPS6214278A/en
Publication of JPH07107695B2 publication Critical patent/JPH07107695B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

PURPOSE:To construct a system which can be applied to a wide scope by connecting an OCR module to a personal computer to travel an incorporated software and offering a data input system by the incorporated software and the OCR. CONSTITUTION:A means to translate a form parameter which the incorporated software has into the data form which the OCR module 50 can process is provided, the form parameter obtained by the same means is transferred to the OCR module 50 and the character written in a form 1 is read. The position of the frame can be assumed by the form parameter, and therefore, the pattern of a frame printed in black and a character pattern can be easily separated. The OCR module returns the read character code to a higher order personal computer, and respective data items are checked by the incorporated software. Thus, the system can be applied to the wide scope and the data input can be executed by recognizing the character.

Description

【発明の詳細な説明】[Detailed description of the invention]

〔発明の対象〕 本発明は文字!!識によりデータを人力する情報処理シ
ステムに係り、特にシステムが出力したフオーム(用紙
)を直接読取ることを特徴とした情報処理方式に関する
。 〔発明の背景〕 従来のOCRでは、入力すべき文字を記入するところの
帳票(伝票)は、0 (”: Rにとって昆えない色(
ドロップアウトカラー)で印刷した専用のものであった
。そのため、このような利用トの制限を緩和するために
、同出願人1こより、黒色で印刷された枠形式の帳票を
直接読取る方式が考案さく2) れている。(特願昭59−180517参照)。このよ
うな方式では、枠構造を帳票画像から自動的に読取って
、更に枠内の文字を認識することによって、各粋の意味
を抽出している。例えば、枠項目の名称、記入データの
種類(地名9人名、生年月日など)2字種2文字数など
に推定する。すなわち、無記入の見本帳票から書式(フ
ォーマット)情報をパターン認識の技術を用いて抽出す
ることができる。したがって、同方式を用いれば、OC
Rを広い範囲で応用するに当っての一つの障害であった
煩雑なフォーマット情報作成作業をなくすことが可能で
ある。しかしながら、同方式は多量の情轄処理を要求す
るため、パーソナルコンピュータを用いるような小規模
な情報処理システムレこは必ずしも向かない。 一方、OCRは小形化されて最小構成のOCRモジュー
ルと化し、L記のような小規模情報処理システムに応用
されつつある。しかしながら、−F記のようなOCRモ
ジュールは、最小構成でなっているために、同モジュー
ル自体にはフォーマツト情報を作成したり、読み取った
データの+1当性チエツクなどを行う機能を持−)でい
ない。そのため、限定されたフォーマット・でのゾ字読
み1〜1)
[Object of the invention] The present invention is a character! ! The present invention relates to an information processing system that manually inputs data based on knowledge, and particularly to an information processing method characterized by directly reading a form output by the system. [Background of the invention] In conventional OCR, the form (slip) on which the characters to be input are written is
It was a special edition printed in dropout color. Therefore, in order to alleviate such restrictions on usage, the same applicant has devised a method to directly read frame-type forms printed in black2). (See patent application No. 59-180517). In such a method, the meaning of each style is extracted by automatically reading the frame structure from the form image and recognizing the characters within the frame. For example, it is estimated that the name of the frame item, the type of data to be entered (name of nine people, date of birth, etc.), two character types, two character counts, etc. That is, format information can be extracted from a blank sample form using pattern recognition technology. Therefore, if the same method is used, OC
It is possible to eliminate the complicated work of creating format information, which has been one of the obstacles to applying R in a wide range of applications. However, since this method requires a large amount of information processing, it is not necessarily suitable for small-scale information processing systems such as those using personal computers. On the other hand, OCR has been miniaturized into an OCR module with a minimum configuration, and is being applied to small-scale information processing systems such as those described in L. However, since the OCR module described in -F has a minimum configuration, the module itself does not have functions such as creating format information and checking the +1 validity of the read data. not present. Therefore, in a limited format・Zoji reading 1~1)

【。 か行えず広い範囲の応用に工L;λることが鐙しい。 〔発明の目的〕[. However, it is difficult to apply it to a wide range of applications. [Purpose of the invention]

本発明の目的は、L記の問題点を解決することにより、
広い範囲の応用に適用することができ、かつ文字認識に
よりデータ入力がpr能な情報処理方式を提供すること
にある。 (発明の概要) 近年、パソコンなどの小形の情報処理システムにおいて
、統合ソフトウェアがビジネス用に開発されている。こ
れらのソフトウェアシステムでは主に数値データを扱っ
ているが、データ人力編集機能、データベース機能9作
図・作表機能、軸91書作成機能などが一体となってい
て、広い応用が期待されている。しかし、データ人力は
キーボードからの人手入力に頼っている。 本発明方式は、L記の統合ソフトウェアとOCRによる
データ入力方式を提供することによす、広い範囲に適用
可能な情報処理システム詮構築するものである。 統合ソフトウェアは、通常、数値データを主体としてお
り、同データの入力に当っては、入出力用のフォーtz
 (帳票)をプリントする機能や、端末のスクリーン上
に入力操作するガイドとして枠組を表示する機能を有し
ている。更には上記帳票やスクリーン上のフィールド(
枠組の中の−っの枠に対応する)に入力されたデータの
正当性をチェックする機能などを有している0例えば、
文字種2桁数、データの種類などのチェックや、フィー
ルド間に定義された関係を満たしているか否かのチェッ
クを行うことが出来る。フィールドの総和が正いしいか
否かを判断するサムチェックはその一例である。 また、入出力用フオームに入力すべきデータを筆記し、
キーボードから入力することも通常行われる。この場合
、システムはフオームに関するパラメータ(フィールド
の位置、データの種類1桁数、フィールド間の満たすべ
き条件など)を内部に記憶している。 従って、−F記のような統合ソフトウェアを走らせるパ
ーソナルコンピュータにOCRモジュールを接続させ、
以下のような新しい方式をさることにより全体として効
率の良い情報処理システムを構築することができる。 すなわち、統合ソフトウェアが有するフオームパラメー
タをOCRモジュールが処理可能なデータ形に翻訳する
手段を設け、同手段によって得られるフオームパラメー
タをOCRモジュールに転送し、フオームに筆記した文
字を読み取らせることができる。その際に、フオームは
ドロップアウトカラーで印刷した特殊な帳票でなくても
、通常のプリンタで作成したものでもよい、フオームパ
ラメータにより枠の位数を推定することが出来るので、
黒色で印刷された枠のパターンと文字パターンとを容易
に分離することが出来る。 更に、該OCRモジュールは読み取った文字コードを上
位パーソナルコンピュータに返送し、該統合ソフトウェ
アにより、各データ項目のチェツりが行オ)れる。 〔発明の実施例〕 以下、本発明を実施例にもとづいて説明する。 第1図は本発明方式の一実施例である情報処理システ1
1の構成図である。システムはCRT表示装w20.磁
気ディスク(ファイル)30.プリンタ40をもつパソ
コン処理装置10と、OCRモジュール50とから成っ
ている。また、処理袋WI110は通信回線101を通
して大形計算機100に接続することが出来る。 システムへのデータ入力は(”: RT 201:表示
される画面の案内に従ってキーボード21から行う機能
と、プリンタ40でプリントしたフオーム(帳票)番:
記入した文字をOCR千ジュール50から読取る機能と
を持つ。第2図はプリンタ40で出力するデータ入力用
フオームの例である。 0CR50は、同図の如く黒色でプリントされた枠形式
のフオームかに文字を読取るごとが出来る。 もちろん、従来のOCR用m票であってもよい。 第3図は本システ11を制御するソフトウェアの主なろ
機能ブロックを示す。ソフトウェアはビジネス用統合ソ
フトウェア60と文字認識人力制御モジュール7とから
成り、処理装置10の]・で走る。主要な処理の流れは
以ドのようである。 まず、入出カフオームパラメータ定義機能62を用いて
、例えば第2図に示すようなフオームに新規に定義して
、その定義パラメータをファイル31に格納する。同定
義では、表(枠構造)の定義とともに、どの枠がデータ
人力用枠かとか、各枠(フィールド)を埋めるデータの
種類(数値か英数文字コードかなど)、最人望字数(桁
数)、フィールド間の関係(例えば縦方向に加算した結
果が合計の値になる)などを定義することができ、これ
らもパラメータとしてファイル31に格納される。 定義されたフオームパラメータに基づいて、人出カフオ
ームプリント機能6:(により第2図にボすような入力
用フオームのプリン!・や、ファイル32内のデータに
基づくレポートプリントを作成することが出来る。入力
用フオームの作成は同プリント機能により大量にプリン
トしてもよいし、一枚のプリントから大量な複写を作成
してもよい。 データ入力は、1−記の如く作成されたフオームにデー
タを記入し、0CR50に読み取らせることにより行え
る。 0CR50の起動は端末20.21からデータ入力編集
プログラム64を介して行われる。同プログラム64内
部には、データ入力を端末20゜21側から行うか、O
CR側から行うかを選択するソフト的スイッチを持って
いる。もし、同スイッチがOCR側にセットされている
場合は、キーボード21からデータ入力をする代りに、
入力要求信号をOCR制御制御プログラエフ1ヘソフト
的る。キーボード側にセットされている場合は、キーボ
ードからの入力データを受付る。 端末20.21から上記スイッチをOCR側にセットす
るコマンドを投入すると、システムは既に定義されてい
る入力用フオームの種類をメニューとしてCRT20に
表示し、読み取ろうとしているフオームがどのフオーム
であるのかを指示するようにユーザに促す。キーボード
21から・−)のフオームが選択されると、プログラム
64は、同フオームパラメータをファイル31から読み
出して、プログラム72に渡す。 OCRフォーマットパラメータ作成プロゲラ!、72は
入力用フオームのパラメータをファイル31より受は取
って、OCR50内の文字切出しプログラムへ、各文字
枠の位置情報9字種情報、桁数(最大文字数)情報など
を送る。ここで、一般にOCRフォーマットパラメータ
とフオーム定義パラメータとは記述形式が異るため、フ
オーム定義パラメータを解釈して、OCRフォーマット
パラメータ形式に変換(翻訳)することが必要である。 プログラム72は同形式変換を行った」;で上記パラメ
ータを0CR50に転送する。 データ入力装置を選択するスイッチがOCR側にセット
されると、プログラム64はOCRからの入力を終了さ
せる所定のキーが押されるが、OCRから終了を知らせ
る信号が来るまでは、フィールド毎にデータ入力の要求
をOCR制御プログラム71に出す。 OCR制御プログラム71は、初期状態にあるときは0
0R装置50に対し千紙送11要求を出し、第1フイー
ルドの読み取りを行い、読み取り結果はプロゲラl’=
 71 &経由してプログラム64へ返送される。プロ
ゲラ1171は各フィールドの読み取りが終了すると読
み取り結果に返送するとともに、プロゲラ1172から
得るパラメータにより、同人カフオームのすべてのフィ
ールドの読み取りが終了したか否かのチェックを行う。 全フィールドの読み取りが終了した場合は、フオーム読
み取り終了フラグをプログラム64へ転送するとともに
、読み取りを終了したフォー!、(帳票)をOCRの読
み取りステーションから排出する要求を0CR50に対
して出力し、引続いて欣のフオームの紙送りを要求する
。 データ入力編集プログラム64は、各フィールドに対す
る読み取り結果を受取ると−」】、所定のバッファに記
憶し、に記フオーム読み取り終了フラグを受取ると該バ
ッファ内のデータのチェックをプログラム65.66を
用いて行う。同チェックは、ファイル:31に記録され
ている。人出内用フオーム定義パラメータに基づいて行
う。読み取り結果が同チェックによりiE L、 <な
いことが分−)た場合は、該フオームのイメージと読み
改番)結束をCRT20に表示し、更に誤i1のある箇
所をブリンキングなどにハイライ1−する。オペレータ
は該表示に従って誤りを訂+Eすることができる。(:
 Ri’20に表示するフオームイメージは、r)r:
 Rtx用いない場合に、キーボードからのデータ人力
をガイドするための枠構造と同・のものとすることが出
来る。一般に、#A頓に印刷する枠構造(フオーム)と
CRTに表示する枠構造とは等しいことが望ましい。 次に、入出カフオームパラメータ定義に−】いて第2図
に示すフオームを例にとって説明する。同図のフオーム
は以ドの如く定義できる。 DEFINE FORM−^;(1) 1′1EF IIEAD)!R’入金票’ ClイNT
):R;        (2)DEF ROWS C
AB、旧、R2,R3,R4;        (:(
)1)EF COL11MNS^(10)、B(10)
、C(10)、n(10);    (4)rlEF 
FTEl、T) LAB(A)=’品名コード’ ; 
     (5)11FF F置r) CAB(B)=
’lN    価’ 、      (6)叶F FT
El、D 1.AB((’、)=’数   量’ 、 
     (7)DPF FIE!1.rl CAR(
D)=’金   額’ 、      (8)DEF 
FTF!1.D R4(A)=’合   計’ 、  
     (9)OFF FIHLDS R1=TNP
tlT(N、5);          (10)nE
F FTF!1.Ds R2=INpHT(N、5):
          (11)nFF FTElnS 
R3=INPIIT(N、5);        (1
2)nEF FTHl、r) R4(11)=’[NP
IIT(N、5);         (13)11F
F  C(lNnTTTON 旧(11)*R1(C)=R1(n);       
(14)D)iF  C0NrlTTION R2(R)誉R2(r、)=R2(n);      
   (15)DEF  C0NIIITION R3(B) * R3(C)=R3([’l):   
      (lf’1)DEF  C0N111TT
ON 旧(D)+R2([1)+R3(n)=R4(I)):
    (17)nllFCnNnlTTON ■(1)<ト’11.E(PConF);      
           (18)rlF!F  C0N
DTTTON R2(A)<FTLH(PCOl)H) ;     
   (19)DHF  C0NIIITT(IN R3(^)<FTl、f!(PCOnF);     
     (20)DEF HEIGIIT I、Al
l  1.5;               (21
)DFF HIETG)IT R11,5:     
   (22)DEF HETGIIT R21,5;
                (23)DEF H
HIGHT R31,5;             
   (24)Dr!F HEIG)IT R4] 、
5:                (25)END
 FORM−A;               (2
6)上記定義文において行1.26は定義の開始と終了
を宣言する。行2はフオームの晃出しを定義し中央にプ
リントすることを宣言する。行3は定義するフォー!、
(すなオ)ち表)の行が5つの行から成っていることを
定義すると同時に、各行にそれぞれL A R、R1、
R2、R3,R4という仮の名前を付けている。行4は
同様に該表の列を定義する。 行5〜9はフィールドを定義し、ここでは等時の右側の
定数を埋込むことを指定する。 行10〜12はフィールドをまとめて定義するものであ
り、例えば行10は、該表の行R1のすべてのフィール
ドはデータ入力用のフィールドであ1)、入力データを
記述する9字種は数字(N)であることおよび数字の最
大桁数が5であることを意味している。行13は同様に
フィールドR4(1))は人力用であり、最大5桁の数
字が5【1人されることを意味している。ここで、フィ
ールドは行の名前とカッコで囲まれる列の名前とで指定
される。 行14〜20は各フィールド間のデータが満すべき条件
を定義している。この内科14〜17は四則演算は条件
である。行18〜20は、フィールドR1(A)、R2
(A)、R3(A)のデータがファイルPCO1′IF
(部品コードを記したファイル)で定義されろデータ集
合の一つのメンバになっているという条件を規定してい
る。 行21〜25は該表の各行がプリンタの文字行1.5 
ピッチ分の高さを持つことを規定してる。 同表の列の幅は列の定義文で規定し、行4において、各
列はプリンタの文字10ピツチであると規定している。 以l二説明したフォー!、パラメータ(定aり)はプロ
グラム62によって作られ、ファイル;31に格納され
る。 OCRフォーマットパラメータ什成プ[1グラム72は
F−記フオームパラメータをファイル31より読み出し
、OCRが解釈+i(能なデータ形式に倹換する。 ファイル;31には、別途プリンタの属性やプリント−
ヒの約束事項に関するパラメータが記憶されている。例
えば、プリンタ40の一文字の(フォント)の幅、高さ
、横方向ピッチと縦方向ピッチといった属性は0.1■
堅位で記憶されている。 あるいは、兄出しがプリントされる行位置、表の最1〕
位の行がプリントされろ行位置、などが記憶されている
。 プログラム72は該情報と該フオームパラメータとによ
って、入力用フィールドのすべてに−)いて、該フィー
ルドの位置、大きさ、文字数をJt体的に計算すること
が出来、これらの情報は0CR50へ転送される。また
、入力用フィールドの数は00R制御プログラム71へ
渡される。 0CR50は公知の技術によって構成される。 従来と異なるのは、フオーム上の枠(表)の位置をパタ
ーンかに捜す手段と、枠パターンの内側の領域の画像を
切り出す手段とにある。これらの手段については、別発
明(特願昭59−180517.特願昭58−2342
48 、特願昭59−1918)に開示しであるので詳
細説明は省略するが、スキャナから入力した画像から線
構造を抽出し、最大輪郭をもつ矩形パターンの四隅の座
標から、基準となる表の位置を決定することが出来る。 基準が決定されれば、各フィールドの詳細な位置は、L
記の方法によって正確に求められる。 正確に定められた画像の部分領域からフィールドに対応
する文字パターン群を抽出すること、および各文字パタ
ーンをle!識することも従来技術により賽易に実現で
きる。 以トのように18識された文字の結果コードはOCR制
御プログラム71に経由してデータ人力編集プログラム
64へ送られる。該プロクラ1564は、フオームパラ
メータを参照して、第21mのフオームの場合は、定義
文の行10〜1;3を読み取って、各読み取りJ結果が
数字であること、桁数が5桁までであること、および定
義文15〜17の四則演算式に満すことをチェックする
。 また、品名コードの列に対する読み取り結果に、対して
は、pconF、という名称のファイルを読み込んで、
該ファイルで定義される品名コードの集合に含まれてい
るか否かをチェックする。 条件を満足しない場合は、前記したようにオペレータに
修正を促す。 以−トの実施例は、データ処理やデータベースの機能は
パーソナルコンピュータ10のトで走る統合ソフトウェ
ア60にある例であったが、本発明は同形態に限定され
ることはなく、■:記種機能大形ホスト] 00−、h
にある場合をも含む、その場合は、パソコン10はホス
ト100の端末として機能し、ファイル30の中身はホ
スト100が有するファイルシステムに記憶されている
。この場合も、本発明の本質は変わらない。 更に、本実施例では、フオーノ、定義のパラメータ(フ
ァイル31)の中に、各フィールドの属性情報が記録さ
れているが、汎用のデータベース管理ゾ[1グラム(+
)BMs)の場合には、フオーム定義とは別に、データ
ベースのデータ属性として4を録されている。したか−
)で、汎用データベース管理プロゲラlいと一体どじて
実現されるシステムの場合には、フオーム定義とデータ
定義とは別のファイルで管理される9に記の形態も本発
明方式に含まれる。 また更に、本実施例のOCRモジュールは直接帳票をス
キャンして文字を読み取るものとしたが、別途スキャン
して光ディスクなどに予め記憶されている画像情報に入
力して、史学認識してもよく、この場合も本発明に含ま
れる。 〔発明の効果〕 以上、本発明方式によれば、従来のOCRで要求された
煩雑な作業であるところのフォーマットパラメータ(書
式情報)の作成が不要となり、データ処理やデータベー
スの機能をも−)ソフトウ−[アとOCRとを容易に結
合した効率的な情報処理システムが構築できる。更に、
同システlいではOCR特有の入力帳票を別途設計する
必要がなく、たとえば同システ11でプリントしたフォ
ー!、自体を使うことがnf能となり、経済性および即
応性IJ富んだシステムが構築できる。 図面のfil’l単な説明 第1図はシステlい構成図、第7Mは人力用帳−■の例
、第3図はラフ1〜ウエアの機能ブ11ツ)) 図Fあ
る。 10・・パーソナルコンピュータ、2 rl −(: 
RT表示装置、二30・・ファイル装置t、40 プリ
ンタ、50・・OCr<モジュール、1−11!4票(
フォー!、)、100・大形ホス1へ。
The purpose of the present invention is to solve the problems described in L.
The object of the present invention is to provide an information processing method that can be applied to a wide range of applications and that can input data through character recognition. (Summary of the Invention) In recent years, integrated software has been developed for business use in small information processing systems such as personal computers. Although these software systems mainly handle numerical data, they are expected to have a wide range of applications, as they integrate functions such as manual data editing, database functions, 9 charting and tabulation functions, and axis 91 document creation functions. However, human data input relies on manual input from a keyboard. The method of the present invention is to construct an information processing system that can be applied to a wide range of areas by providing the integrated software described in L and a data input method using OCR. Integrated software usually consists of numerical data, and when inputting that data, an input/output format is required.
It has the function of printing (forms) and the function of displaying a frame as a guide for input operations on the terminal screen. Furthermore, the fields on the above forms and screens (
For example, 0 has a function to check the validity of data input in the frame (corresponding to the frame -)
You can check the character type, 2-digit number, data type, etc., and check whether the relationships defined between fields are satisfied. One example is a sum check that determines whether the sum of fields is correct. Also, write down the data to be input into the input/output form,
Input from a keyboard is also commonly performed. In this case, the system internally stores parameters related to the form (field positions, data type, number of digits, conditions to be satisfied between fields, etc.). Therefore, connect the OCR module to a personal computer running integrated software such as -F.
By implementing new methods such as those described below, it is possible to construct an overall efficient information processing system. That is, a means is provided for translating form parameters possessed by the integrated software into a data format that can be processed by the OCR module, and the form parameters obtained by the means are transferred to the OCR module to read characters written on the form. At that time, the form does not have to be a special form printed in dropout color, it can be created with a normal printer, and the order of the frame can be estimated from the form parameters.
The frame pattern printed in black and the character pattern can be easily separated. Furthermore, the OCR module returns the read character code to the host personal computer, and each data item is checked by the integrated software. [Examples of the Invention] The present invention will be described below based on Examples. FIG. 1 shows an information processing system 1 which is an embodiment of the method of the present invention.
FIG. 1 is a configuration diagram of No. 1. The system is a CRT display w20. Magnetic disk (file) 30. It consists of a personal computer processing device 10 having a printer 40 and an OCR module 50. Further, the processing bag WI 110 can be connected to the large computer 100 through the communication line 101. Data input to the system is performed using the keyboard 21 according to the instructions on the displayed screen (RT 201) and the form number printed by the printer 40:
It has a function to read written characters from OCR 50 thousand joules. FIG. 2 is an example of a data input form output by the printer 40. With the 0CR50, characters can be read in a frame-like form printed in black as shown in the figure. Of course, the conventional m-sheet for OCR may also be used. FIG. 3 shows the main functional blocks of software that controls this system 11. The software consists of a business integrated software 60 and a character recognition human control module 7, and runs on the processor 10. The main processing flow is as follows. First, using the input/output cafform parameter definition function 62, a new form is defined, for example, as shown in FIG. 2, and the defined parameters are stored in the file 31. In addition to defining the table (frame structure), this definition also includes information such as which frames are for human data input, the type of data to be filled in each frame (field) (numeric value or alphanumeric character code, etc.), the maximum number of characters (digits), etc. (number), relationship between fields (for example, the result of vertical addition is the total value), etc., and these are also stored in the file 31 as parameters. Based on the defined form parameters, it is possible to print the input form as shown in Figure 2 or to create a report print based on the data in the file 32. Yes, you can create the input form by printing a large number of copies using the same print function, or by creating a large number of copies from a single print.Data input can be done using the form created as described in 1-1. This can be done by entering data and having the 0CR50 read it.The 0CR50 is activated from the terminal 20.21 via the data input editing program 64.Inside the program 64, data is input from the terminal 20.21 side. ka, O
It has a software switch to select whether to perform it from the CR side. If the switch is set to the OCR side, instead of inputting data from the keyboard 21,
The input request signal is sent to the OCR control program 1 by software. If it is set on the keyboard side, input data from the keyboard is accepted. When you enter a command to set the above switch to the OCR side from the terminal 20.21, the system displays the types of input forms that have already been defined as a menu on the CRT 20, and displays the form you are trying to read. Prompt the user for instructions. When the form . OCR format parameter creation progera! , 72 receives input form parameters from the file 31, and sends position information of each character frame, 9 character type information, digit number (maximum number of characters) information, etc. to the character cutting program in the OCR 50. Here, since OCR format parameters and form definition parameters generally have different description formats, it is necessary to interpret the form definition parameters and convert (translate) them into the OCR format parameter format. The program 72 transfers the above parameters to 0CR50 with the same format conversion. When the switch for selecting the data input device is set to the OCR side, the program 64 presses a predetermined key to end input from the OCR. A request is issued to the OCR control program 71. The OCR control program 71 is 0 in its initial state.
A thousand paper feed 11 request is issued to the 0R device 50, the first field is read, and the reading result is Progera l'=
71 & is sent back to the program 64 via &. When the reading of each field is completed, the progera 1171 sends back the reading result, and also checks whether the reading of all the fields of the doujin kafoom is finished using the parameters obtained from the progera 1172. When reading of all fields is completed, the form reading completion flag is transferred to the program 64, and the form reading completion flag is transferred to the program 64. , (form) from the OCR reading station is output to the OCR 50, and then a request is made to feed the paper form. When the data input editing program 64 receives the read result for each field, it stores it in a predetermined buffer, and when it receives the form read end flag described in , it checks the data in the buffer using programs 65 and 66. conduct. This check is recorded in file:31. This is done based on the form definition parameters for in-person attendance. If the reading result shows that there is no iEL by the same check, display the image of the form and the binding (pronunciation change) on the CRT 20, and further highlight the incorrect i1 on the blinking etc. do. The operator can correct the error according to the display. (:
The form image displayed on Ri'20 is r) r:
When Rtx is not used, the frame structure can be the same as that used to guide data input from the keyboard. Generally, it is desirable that the frame structure (form) printed on #A is the same as the frame structure displayed on the CRT. Next, the input/output cuff form parameter definition will be explained using the form shown in FIG. 2 as an example. The form in the figure can be defined as follows. DEFINE FORM-^; (1) 1'1EF IIEAD)! R'Deposit slip' Cl-NT
):R; (2) DEF ROWS C
AB, old, R2, R3, R4; (:(
)1) EF COL11MNS^(10), B(10)
, C(10), n(10); (4) rlEF
FTEl, T) LAB(A)='product name code';
(5) 11FF F position r) CAB(B)=
'lN valence', (6) Kano F FT
El, D 1. AB((',)='quantity',
(7) DPF FIE! 1. rl CAR(
D) = 'amount', (8) DEF
FTF! 1. DR4(A)='total',
(9) OFF FIHLDS R1=TNP
tlT(N, 5); (10)nE
FFTF! 1. Ds R2=INpHT(N, 5):
(11) nFF FTElnS
R3=INPIIT(N, 5); (1
2) nEF FTHl, r) R4(11)='[NP
IIT (N, 5); (13) 11F
F C(lNnTTTON old(11)*R1(C)=R1(n);
(14) D) iF C0NrlTTION R2(R) Homare R2(r,)=R2(n);
(15) DEF C0NIIITION R3(B) * R3(C)=R3(['l):
(lf'1)DEF C0N111TT
ON Old (D) + R2 ([1) + R3 (n) = R4 (I)):
(17)nllFCnNnlTTON ■(1)<g'11. E(PConF);
(18) rlF! F C0N
DTTTON R2(A)<FTLH(PCOl)H);
(19) DHF C0NIIITT(IN R3(^)<FTl,f!(PCOnF);
(20) DEF HEIGIIT I, Al
l 1.5; (21
)DFF HIETG)IT R11,5:
(22) DEF HETGIIT R21,5;
(23) DEF H
HIGHT R31,5;
(24) Dr! FHEIG)IT R4],
5: (25) END
FORM-A; (2
6) In the above definition statement, lines 1.26 declare the start and end of the definition. Line 2 defines the beginning of the form and declares that it will be printed in the center. Row 3 defines four! ,
At the same time, we define that the rows in (i.e. table) consist of five rows, and at the same time we write L A R, R1, R1,
They have been given tentative names R2, R3, and R4. Row 4 similarly defines the columns of the table. Lines 5 to 9 define fields and specify that constants on the right side of the isochrones are to be embedded. Rows 10 to 12 define fields collectively. For example, in row 10, all fields in row R1 of the table are fields for data input1), and the nine character types that describe input data are numbers. (N) and the maximum number of digits is 5. Similarly, field R4(1)) in row 13 is for manual input, meaning that a maximum of 5 digits can be input by 5 [1 person. Here, fields are specified by row names and column names enclosed in parentheses. Lines 14-20 define the conditions that the data between each field must satisfy. For Internal Medicine 14-17, four arithmetic operations are a condition. Rows 18-20 are fields R1(A), R2
(A), R3(A) data is file PCO1'IF
It specifies the condition that it is a member of a data set defined in (a file that describes part codes). For rows 21 to 25, each row of the table corresponds to 1.5 character lines of the printer.
It stipulates that the height be equal to the pitch. The width of the columns in the table is specified by the column definition statement, and in line 4 it is specified that each column is 10 printer character pitches. The four I explained below! , parameters (constants) are created by the program 62 and stored in the file 31. The OCR format parameter configuration program [1gram 72 reads the F-form parameters from the file 31 and converts them into a data format that can be interpreted by OCR.
Parameters regarding the terms and conditions of the agreement are stored. For example, the attributes such as the width, height, horizontal pitch, and vertical pitch of a single character (font) of the printer 40 are 0.1■
He is remembered for his hard work. Or, the row position where the eldest is printed, the first row in the table]
The line position, etc., where the next line will be printed is memorized. Using this information and form parameters, the program 72 can calculate the position, size, and number of characters of all input fields in Jt format, and this information is transferred to 0CR50. Ru. Further, the number of input fields is passed to the 00R control program 71. 0CR50 is constructed using known technology. What is different from the conventional method is the means for searching the position of the frame (front) on the form using a pattern, and the means for cutting out the image of the area inside the frame pattern. Regarding these means, separate inventions (Japanese Patent Application No. 59-180517, Patent Application No. 58-2342)
48, Japanese Patent Application No. 59-1918), so a detailed explanation will be omitted, but the line structure is extracted from the image input from the scanner, and a reference table is created from the coordinates of the four corners of the rectangular pattern with the maximum outline. It is possible to determine the location of Once the criteria is determined, the detailed location of each field is determined by L
It can be accurately determined by the method described below. Extracting a group of character patterns corresponding to a field from an accurately defined partial region of an image, and extracting each character pattern from le! This can also be easily achieved using conventional technology. The result code of the 18 characters identified as described above is sent to the data manual editing program 64 via the OCR control program 71. The programmer 1564 refers to the form parameters, reads lines 10 to 1; It is checked that this is true and that the four arithmetic expressions in definition statements 15 to 17 are satisfied. Also, for the reading results for the product name code column, read the file named pconF,
Check whether it is included in the set of product name codes defined in the file. If the conditions are not satisfied, the operator is prompted to make corrections as described above. In the embodiment described above, the data processing and database functions are provided in the integrated software 60 running on the computer 10, but the present invention is not limited to the same form. Large functional host] 00-, h
In that case, the personal computer 10 functions as a terminal of the host 100, and the contents of the file 30 are stored in a file system owned by the host 100. Even in this case, the essence of the invention does not change. Furthermore, in this embodiment, the attribute information of each field is recorded in the phono and definition parameters (file 31).
) BMs), apart from the form definition, 4 is recorded as a data attribute in the database. Did you?
), in the case of a system that is realized in combination with a general-purpose database management programmer, the form described in item 9, in which the form definition and data definition are managed in separate files, is also included in the system of the present invention. Furthermore, although the OCR module of this embodiment directly scans the form and reads the characters, it may also be used for historical recognition by separately scanning and inputting image information stored in advance on an optical disk or the like. This case is also included in the present invention. [Effects of the Invention] As described above, according to the method of the present invention, it is no longer necessary to create format parameters (format information), which is a complicated task required by conventional OCR, and data processing and database functions can also be improved. An efficient information processing system can be constructed by easily combining software and OCR. Furthermore,
With this system, there is no need to separately design input forms specific to OCR. , itself becomes a nf function, and a system rich in economy and quick response can be constructed. Brief explanation of the drawings Fig. 1 is a system configuration diagram, Fig. 7M is an example of a manual for manual use, and Fig. 3 is a rough diagram of functional blocks 1 to 11)) Fig. F. 10...Personal computer, 2 rl -(:
RT display device, 230...File device t, 40 Printer, 50...OCr<module, 1-11!4 votes (
Four! , ), 100・To large Hoss 1.

Claims (1)

【特許請求の範囲】 1、データ入出力用フォームを定義するフォームパラメ
ータを記憶する第1の手段と、該フォームパラメータを
OCR用フォーマットパラメータに変換する第2の手段
と、電気的信号に変換された画像情報から文字パターン
を抽出して文字認識を行う第3の手段とを有する情報処
理システムであって、上記第3の手段は上記第2の手段
が出力するフォーマットパラメータに従って文字パター
ンを抽出して文字認識することを特徴とする情報処理方
式。 2、特許請求の範囲第1項記載の情報処理方式において
、上記情報処理システムは更に、フォーム上の各フィー
ルドのデータ属性とフィールド間に定義される束縛条件
とを記憶する第4の手段を有し、第3の手段で文字認識
した結果は第4の手段で記憶する条件を満足するか否か
を判断することを特徴とする情報処理方式。 3、特許請求の範囲第1項記載の情報処理方式は、更に
該データ入出力用フォームを定義する第5の手段と、該
手段で定義されるフォームパラメータに従ってフォーム
を出力する第6の手段とを有し、該第6の手段で作成し
たフォームを第3の手段で認識することを特徴とする情
報処理方式。
[Claims] 1. A first means for storing form parameters that define a data input/output form, a second means for converting the form parameters into OCR format parameters, and a first means for storing form parameters that define a data input/output form; a second means for converting the form parameters into OCR format parameters; and a third means for extracting a character pattern from the image information to perform character recognition, the third means extracting a character pattern according to a format parameter output by the second means. An information processing method characterized by character recognition. 2. In the information processing method according to claim 1, the information processing system further includes fourth means for storing data attributes of each field on the form and constraint conditions defined between the fields. The information processing method is characterized in that the result of character recognition by the third means determines whether or not the result satisfies a condition to be stored by the fourth means. 3. The information processing method according to claim 1 further comprises a fifth means for defining the data input/output form, and a sixth means for outputting the form according to form parameters defined by the means. An information processing method characterized in that the form created by the sixth means is recognized by the third means.
JP60152209A 1985-07-12 1985-07-12 Information processing system Expired - Lifetime JPH07107695B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60152209A JPH07107695B2 (en) 1985-07-12 1985-07-12 Information processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60152209A JPH07107695B2 (en) 1985-07-12 1985-07-12 Information processing system

Publications (2)

Publication Number Publication Date
JPS6214278A true JPS6214278A (en) 1987-01-22
JPH07107695B2 JPH07107695B2 (en) 1995-11-15

Family

ID=15535450

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60152209A Expired - Lifetime JPH07107695B2 (en) 1985-07-12 1985-07-12 Information processing system

Country Status (1)

Country Link
JP (1) JPH07107695B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03134784A (en) * 1989-10-20 1991-06-07 Hitachi Ltd Optical reader

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56137480A (en) * 1980-03-28 1981-10-27 Nec Corp Format input device
JPS588385A (en) * 1981-07-06 1983-01-18 Fujitsu Ltd Designation system for reading position of ocr form
JPS59165187A (en) * 1983-03-10 1984-09-18 Fujitsu Ltd Optical character reader

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56137480A (en) * 1980-03-28 1981-10-27 Nec Corp Format input device
JPS588385A (en) * 1981-07-06 1983-01-18 Fujitsu Ltd Designation system for reading position of ocr form
JPS59165187A (en) * 1983-03-10 1984-09-18 Fujitsu Ltd Optical character reader

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03134784A (en) * 1989-10-20 1991-06-07 Hitachi Ltd Optical reader

Also Published As

Publication number Publication date
JPH07107695B2 (en) 1995-11-15

Similar Documents

Publication Publication Date Title
JP4356847B2 (en) Field definition information generation method, line and field definition information generation device
US6897851B2 (en) Methods and apparatus for formatted entry of electronic ink
US11210506B2 (en) Information processing apparatus and non-transitory computer readable medium
JP2000268109A (en) Template production device for electronic clinical chart system and input device for electronic clinical chart using the template
JPS6214278A (en) Information processing system
JPS59212838A (en) Method for designing slips and vouchers
JP3029822B2 (en) Document processing apparatus, document processing method, and computer-readable recording medium recording program for causing computer to execute the method
JPH01119859A (en) Business form issuance processing system
JP2997666B1 (en) Data printing program generation method
JP2692196B2 (en) Test data editing method
JPH0452866A (en) Automatic formation system for operation program
JPH0991359A (en) Method and device for designing physical file
JPH0754515B2 (en) Japanese document processing system
JPS61288270A (en) Document design system
JPH08249416A (en) Optical character reading system and its form preparation
JPH0664593B2 (en) Form design system
JPH07129393A (en) Method and device for preparing program and method and device for preparing printing image data
JPH0374776A (en) Method and device for preparing control program of optical reader
JPH11184949A (en) Slip processing device and storage medium
JPS62274461A (en) Slip design system
JPH03237516A (en) Form preparing system
JPH0399382A (en) Method for forming control program for optical reader
JP2002133051A (en) Device for preparing business model
JPS61288269A (en) Document design system
JPH0399384A (en) Method for forming control program for optical reader

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term