JPH07107695B2 - 情報処理システム - Google Patents

情報処理システム

Info

Publication number
JPH07107695B2
JPH07107695B2 JP60152209A JP15220985A JPH07107695B2 JP H07107695 B2 JPH07107695 B2 JP H07107695B2 JP 60152209 A JP60152209 A JP 60152209A JP 15220985 A JP15220985 A JP 15220985A JP H07107695 B2 JPH07107695 B2 JP H07107695B2
Authority
JP
Japan
Prior art keywords
ocr
input
parameter
data
def
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP60152209A
Other languages
English (en)
Other versions
JPS6214278A (ja
Inventor
浩通 藤澤
康明 中野
歳弘 花野井
正雄 道野
清道 栗野
修 国崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP60152209A priority Critical patent/JPH07107695B2/ja
Publication of JPS6214278A publication Critical patent/JPS6214278A/ja
Publication of JPH07107695B2 publication Critical patent/JPH07107695B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔発明の対象〕 本発明は文字認識によりデータを入力する情報処理シス
テムに係り、特にシステムが出力したフオーム(用紙を
直接読取ることを特徴とした情報処理方式に関する。
〔発明の背景〕
従来のOCRでは、入力すべき文字を記入するところの帳
票(伝票)は、OCRにとつて見えない色(ドロツプアウ
トカラー)で印刷した専用のものであつた。そのため、
このような利用上の制限を緩和するために、同出願人に
より、黒色で印刷された枠形式の帳票を直接読取る方式
が考案されている。(特願昭59−180517参照)。このよ
うな方式では、枠構造を帳票画像から自動的に読取つ
て、更に枠内の文字を認識することによつて、各枠の意
味を抽出している。例えば、枠項目の名称,記入データ
の種類(地名,人名,生年月日など),字種,文字数な
どを推定する。すなわち、無記入の見本帳票から書式
(フオーマツト)情報をパターン認識の技術を用いて抽
出することができる。したがつて、同方式を用いれば、
OCRを広い範囲で応用するに当つての一つの障害であつ
た煩雑なフオーマツト情報作成作業をなくすことが可能
である。しかしながら、同方式は多量の情報処理を要求
するため、パーソナルコンピユータを用いるような小規
模な情報処理システムには必ずしも向かない。
一方、OCRは小形化されて最小構成のOCRモジユールと化
し、上記のような小規模情報処理システムに応用されつ
つある。しかしながら、上記のようなOCRモジユール
は、最小構成でなつているために、同モジユール自体に
はフオーマツト情報を作成したり、読み取つたデータの
正当性チエツクなどを行う機能を持つていない。そのた
め、限定されたフオーマツトでの文字読み取りしか行え
ず広い範囲の応用に応えることが難しい。
〔発明の目的〕
本発明の目的は、上記の問題点を解決することにより、
広い範囲の応用に適用することができ、かつ文字認識に
よりデータ入力が可能な情報処理方式を提供することに
ある。
〔発明の概要〕
近年、パソコンなどの小形の情報処理システムにおい
て、統合ソフトウエアがビジネス用に開発されている。
これらのソフトウエアシステムでは主に数値データを扱
つているが、データ入力編集機能,データベース機能,
作図・作表機能,報告書作成機能などが一体となつてい
て、広い応用が期待されている。しかし、データ入力は
キーボードからの人手入力に頼つている。
本発明方式は、上記の統合ソフトウエアとOCRによるデ
ータ入力方式を提供することにより、広い範囲に適用可
能な情報処理システムを構築するものである。
統合ソフトウエアは、通常、数値データを主体としてお
り、同データの入力に当つては、入出力用のフオーム
(帳票)をプリントする機能や、端末のスクリーン上に
入力操作するガイドとして枠組を表示する機能を有して
いる。更には上記帳票やスクリーン上のフイールド(枠
組の中の一つの枠に対応する)に入力されたデータの正
当性をチエツクする機能などを有している。例えば、文
字種,桁数,データの種類などのチエツクや、フイール
ド間に定義された関係を満たしているか否かのチエツク
を行うことが出来る。フイールドの総和が正いしいか否
かを判断するサムチエツクはその一例である。
また、入出力用フオームに入力すべきデータを筆記し、
キーボードから入力することも通常行われる。この場
合、システムはフオームに関するパラメータ(フイール
ドの位置,データの種類,桁数、フイールド間の満たす
べき条件など)を内部に記憶している。
従つて、上記のような統合ソフトウエアを走らせるパー
ソナルコンピユータにOCRモジユールを接続させ、以下
のような新しい方式をさることにより全体として効率の
良い情報処理システムを構築することができる。
すなわち、統合ソフトウエアが有するフオームパラメー
タをOCRモジユールが処理可能のデータ形に翻訳する手
段を設け、同手段によつて得られるフオームパラメータ
をOCRモジユールに転送し、フオームに筆記した文字を
読み取らせることができる。その際に、フオームはドロ
ツプアウトカラーで印刷した特殊な帳票でなくても、通
常のプリンタで作成したものでもよい。フオームパラメ
ータにより枠の位置を推定することが出来るので、黒色
で印刷さえた枠のパターンと文字パターンとを容易に分
離することが出来る。
更に、該OCRモジユールは読み取つた文字コードを上位
パーソナルコンピユータに返送し、該統合ソフトウエア
により、各データ項目のチエツクが行われる。
〔発明の実施例〕
以下、本発明を実施例にもとづいて説明する。
第1図は本発明方式の一実施例である情報処理システム
の構成図である。システムはCRT表示装置20,磁気デイス
ク(フアイル)30,プリンタ40をもつパソコン処理装置1
0と、OCRモジユール50とから成つている。また、処理装
置10は通信回線101を通して大形計算機100に接続するこ
とが出来る。
システムへのデータ入力はCRT20に表示される画面の案
内に従つてキーボード21から行う機能と、プリンタ40で
プリントしたフオーム(帳票)に記入した文字をOCRモ
ジユール50から読取る機能とを持つ。第2図はプリンタ
40で出力するデータ入力用フオームの例である。OCR50
は、同図の如く黒色でプリントされた枠形式のフオーム
かに文字を読取ることが出来る。もちろん、従来のOCR
用帳票であつてもよい。
第3図は本システムを制御するソフトウエアの主なる機
能ブロツクを示す。ソフトウエアはビジネス用統合ソフ
トウエア60と文字認識入力制御モジユール7とから成
り、処理装置10の上で走る。主要な処理の流れは以下の
ようである。
まず、入出力フオームパラメータ定義機能62を用いて、
例えば第2図に示すようなフオームを新規に定義して、
その定義パラメータをフアイル31に格納する。同定義で
は、表(枠構造)の定義とともに、どの枠がデータ入力
用枠かとか、各枠(フイールド)を埋めるデータの種類
(数値か英数文字コードかなど)、最大文字数(桁
数)、フイールド間の関係(例えば縦方向に加算した結
果が合計の値になる)などを定義することができ、これ
らもパラメータとしてフアイル31に格納される。
定義されたフオームパラメータに基づいて、入出力フオ
ームプリント機能63により第2図に示すような入力用フ
オームのプリントや、フアイル32内のデータに基づくレ
ポートプリントを作成することが出来る。入力用フオー
ムの作成は同プリント機能により大量にプリントしても
よいし、一枚のプリントから大量な複写を作成してもよ
い。
データ入力は、上記の如く作成されたフオームにデータ
を記入し、OCR50に読み取らせることにより行える。
OCR50の起動は端末20,21からデータ入力編集プログラム
64を介して行われる。同プログラム64内部には、データ
入力を端末20,21側から行うか、OCR側から行うかを選択
するソフト的スイツチを持つている。もし、同スイツチ
がOCR側にセツトされている場合は、キーボード21から
データ入力をする代りに、入力要求信号をOCR制御プロ
グラム71へソフト的に送る。キーボード側にセツトされ
ている場合は、キーボードからの入力データを受付る。
端末20,21から上記スイツチをOCR側にセツトするコマン
ドを投入すると、システムは既に定義されている入力用
フオームの種類をメニユーとしてCRT20に表示し、読み
取ろうとしているフオームがどのフオームであるのかを
指示するようにユーザに促す。キーボード21から一つの
フオームが選択されると、プログラム64は、同フオーム
パラメータをフアイル31から読み出して、プログラム72
に渡す。
OCRフオーマツトパラメータ作成プログラム72は入力用
フオームのパラメータをフアイル31より受け取つて、OC
R50内の文字切出しプログラムへ、各文字枠の位置情
報,字種情報、桁数(最大文字数)情報などを送る。こ
こで、一般にOCRフオーマツトパラメータとフオーム定
義パラメータとは記述形式が異るため、フオーム定義パ
ラメータを解釈して、OCRフオーマツトパラメータ形式
に変換(翻訳)することが必要である。プログラム72は
同形式変換を行つた上で上記パラメータをOCR50に転送
する。
データ入力装置を選択するスイツチがOCR側にセツトさ
れると、プログラム64はOCRからの入力を終了させる所
定のキーが押されるが、OCRから終了を知らせる信号が
来るまでは、フイールド毎にデータ入力の要求をOCR制
御プログラム71に出す。
OCR制御プログラム71は、初期状態にあるときはOCR装置
50に対して紙送り要求を出し、第1フイールドの読み取
りを行い、読み取り結果はプログラム71を経由してプロ
グラム64へ返送される。プログラム71は各フイールドの
読み取りが終了すると読み取り結果を返送するととも
に、プログラム72から得るパラメータにより、同入力フ
オームのすべてのフイールドの読み取りが終了したか否
かのチエツクを行う。全フイールドの読み取りが終了し
た場合は、フオーム読み取り終了フラグをプログラム64
へ転送するとともに、読み取りを終了したフオーム(帳
票)をOCRの読み取りステーシヨンから排出する要求をO
CR50に対して出力し、引続いて次のフオームの紙送りを
要求する。
データ入力編集プログラム64は、各フイールドに対する
読み取り結果を受取ると一旦所定のバツフアに記憶し、
上記フオーム読み取り終了フラグを受取ると該バツフア
内のデータのチエツクをプログラム65,66を用いて行
う。同チエツクは、フアイル31に記録されている。入出
力用フオーム定義パラメータに基づいて行う。読み取り
結果が同チエツクにより正しくないことが分つた場合
は、該フオームのイメージと読み取り結果をCRT20に表
示し、更に誤りのある箇所をブリンキングなどにハイラ
イトする。オペレータは該表示に従つて誤りを訂正する
ことができる。CRT20に表示するフオームイメージは、O
CRを用いない場合に、キーボードからのデータ入力をガ
イドするための枠構造と同一のものとすることが出来
る。一般に、帳票に印刷する枠構造(フオーム)とCRT
に表示する枠構造とは等しいことが望ましい。
次に、入出力フオームパラメータ定義について第2図に
示すフオームを例にとつて説明する。同図のフオームは
以下の如く定義できる。
DEFINE FORM−A; (1) DEF HEADER‘入金票'CENTER; (2) DEF ROWS LAB,R1,R2,R3,R4; (3) DEF COLUMNS A(10),B(10),C(10),D(10);
(4) DEF FIELD LAB(A)=‘品名コード'; (5) DEF FIELD LAB(B)=‘単価'; (6) DEF FIELD LAB(C)=‘数量'; (7) DEF FIELD LAB(D)=‘金額'; (8) DEF FIELD R4(A)=‘合計'; (9) DEF FIELDS R1=INPUT(N,5); (10) DEF FIELDS R2=INPUT(N,5); (11) DEF FIELDS R3=INPUT(N,5); (12) DEF FIELD R4(D)=INPUT(N,5); (13) DEF CONDITION R1(B)*R1(C)=R1(D); (14) DEF CONDITION R2(B)*R2(C)=R2(D); (15) DEF CONDITION R3(B)*R3(C)=R3(D); (16) DEF CONDITION R1(D)+R2(D)+R3(D)=R4(D); (17) DEF CONDITION R1(A)<FILE(PCODE); (18) DEF CONDITION R2(A)<FILE(PCODE); (19) DEF CONDITION R3(A)<FILE(PCODE); (20) DEF HEIGHT LAB 1.5; (21) DEF HEIGHT R1 1.5; (22) DEF HEIGHT R2 1.5; (23) DEF HEIGHT R3 1.5; (24) DEF HEIGHT R4 1.5; (25) END FORM−A; (26) 上記定義文において行1,26は定義の開始と終了を宣言す
る。行2はフオームの見出しを定義し中央にプリントす
ることを宣言する。行3は定義するフオーム(すなわち
表)の行が5つの行から成つていることを定義すると同
時に、各行にそれぞれLAB,R1,R2,R3,R4という仮の名前
を付けている。行4は同様に該表の列を定義する。行5
〜9はフイールドを定義し、ここでは等号の右側の定数
を埋込むことを指定する。
行10〜12はフイールドをまとめて定義するものであり、
例えば行10は、該表の行R1のすべてのフイールドはデー
タ入力用のフイールドであり、入力データを記述する文
字種は数字(N)であることおよび数字の最大桁数が5
であることを意味している。行13は同様にフイールドR4
(D)は入力用であり、最大5桁の数字が記入されるこ
とを意味している。ここで、フイールドは行の名前とカ
ツコで囲まれる列の名前とで指定される。
行14〜20は各フイールド間のデータが満すべき条件を定
義している。この内行14〜17は四則演算は条件である。
行18〜20は、フイールドR1(A),R2(A),R3(A)の
データがフアイルPCODE(部品コードを記したフアイ
ル)で定義されるデータ集合の一つのメンバになつてい
るという条件を規定している。
行21〜25は該表の各行がプリンタの文字行1.5ピツチ文
の高さを持つことを規定してる。同表の列の幅は列の定
義文で規定し、行4において、各列はプリンタの文字10
ピツチであると規定している。
以上説明したフオームパラメータ(定義文)はプログラ
ム62によつて作られ、フアイル31に格納される。
OCRフオーマツトパラメータ作成プログラム72は上記フ
オームパラメータをフアイル31より読み出し、OCRが解
釈可能なデータ形式に変換する。
フアイル31には、別途プリンタの属性やプリント上の約
束事項に関するパラメータが記憶されている。例えば、
プリンタ40の一文字の(フオント)の幅,高さ,横方向
ピツチと縦方向ピツチといつた属性は0.1mm単位で記憶
されている。あるいは、見出しがプリントされる行位
置、表の最上位の行がプリントされる行位置、などが記
憶されている。
プログラム72は該情報と該フオームパラメータとによつ
て、入力用フイールドのすべてについて、該フイールド
の位置,大きさ,文字数を具体的に計算することが出
来、これらの情報はOCR50へ転送される。また、入力用
フイールドの数はOCR制御プログラム71へ渡される。
OCR50は公知の技術によつて構成される。従来と異なる
のは、フオーム上の枠(表)の位置をパターンかに捜す
手段と、枠パターンの内側の領域の画像を切り出す手段
とにある。これらの手段については、別発明(特願昭59
−180517,特願昭58−234248,特願昭59−1918)に開示し
てあるので詳細説明は省略するが、スキヤナから入力し
た画像から線構造を抽出し、最大輪郭をもつ矩形パター
ンを四隅の座標から、基準となる表の位置を決定するこ
とが出来る。基準が決定されれば、各フイールドの詳細
な位置は、上記の方法によつて正確に求められる。
正確に定められた画像の部分領域からフイールドに対応
する文字パターン群を抽出すること、および各文字パタ
ーンを認識することも従来技術により容易に実現でき
る。
以上のように認識された文字の結果コードはOCR制御プ
ログラム71を経由してデータ入力編集プログラム64へ送
られる。該プログラム64は、フオームパラメータ参照し
て、第2図のフオームの場合は、定義文の行10〜13を読
み取つて、各読み取り結果が数字であること、桁数が5
桁までであること、および定義文15〜17の四則演算式を
満すことをチエツクする。
また、品名コードの列に対する読み取り結果に、対して
は、PCODEという名称のフアイルを読み込んで、該フア
イルで定義される品名コードの集合に含まれているか否
かをチエツクする。
条件を満足しない場合は、前記したようにオペレータに
修正を促す。
以上の実施例は、データ処理やデータベースの機能はパ
ーソナルコンピユータ10の上で走る統合ソフトウエア60
にある例であつたが、本発明は同形態に限定されること
はなく、上記機能が大形ホスト100上にある場合をも含
む。その場合は、パソコン10はホスト100の端末として
機能し、フアイル30の中身はホスト100が有するフアイ
ルシステムに記憶されている。この場合も、本発明の本
質は変わらない。
更に、本実施例では、フオーム定義のパラメータ(フア
イル31)の中に、各フイールドの属性情報が記録されて
いるが、汎用のデータベース管理プログラム(DBMS)の
場合には、フオーム定義とは別に、データベースのデー
タ属性として登録されている。したがつて、汎用データ
ベース管理プログラムと一体として実現されるシステム
の場合には、フオーム定義とデータ定義とは別のフアイ
ルで管理される。上記の形態も本発明方式に含まれる。
また更に、本実施例のOCRモジユールは直接帳票をスキ
ヤンして文字を読み取るものとしたが、別途スキヤンし
て光デイスクなどに予め記憶されている画像情報を入力
して、文字認識してもよく、この場合も本発明に含まれ
る。
〔発明の効果〕
以上、本発明方式によれば、従来のOCRで要求された煩
雑な作業であるところのフオーマツトパラメータ(書式
情報)の作成が不要となり、データ処理やデータベース
の機能をもつソフトウエアとOCRとを容易に結合した効
率的な情報処理システムが構築できる。更に、同システ
ムではOCR特有の入力帳票を別途設計する必要がなく、
たとえば同システムでプリントしたフオーム自体を使う
ことが可能となり、経済性および即応性に富んだシステ
ムが構築できる。
【図面の簡単な説明】
第1図はシステム構成図、第2図は入力用帳票の例、第
3図はソフトウエアの機能ブロツク図である。 10……パーソナルコンピユータ、20……CRT表示装置、3
0……フアイル装置、40……プリンタ、50……OCRモジユ
ール、1……帳票(フオーム)、100……大形ホスト。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 道野 正雄 神奈川県小田原市国府津2880番地 株式会 社日立製作所小田原工場内 (72)発明者 栗野 清道 神奈川県小田原市国府津2880番地 株式会 社日立製作所小田原工場内 (72)発明者 国崎 修 神奈川県横浜市戸塚区吉田町292番地 株 式会社日立製作所マイクロエレクトロニク ス機器開発研究所内 (56)参考文献 特開 昭58−8385(JP,A) 特開 昭56−137480(JP,A) 特開 昭59−165187(JP,A)

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】データ入出力フォームを定義するフォーム
    パラメータを作成するパラメータ定義手段と、該フォー
    ムパラメータに従った枠構造を有する帳票を印刷する印
    刷手段と、上記フォームパラメータ及び上記印刷手段の
    特性データを記憶する記憶手段と、上記フォームパラメ
    ータ及び印刷手段の特性データに従ってOCR制御情報を
    形成するOCRフォーマットパラメータ形成手段と、電気
    的信号に変換された画像情報から上記OCR制御情報に従
    って文字パターンを抽出して文字認識を行なう読取手段
    とを有する情報処理システム。
  2. 【請求項2】前記データ入出力フォームが複数種類定義
    されている場合、該複数のデータ入出力フォームの種類
    を表示する手段と、該複数のデータ入出力フォームから
    任意の一つを選択する手段とを有し、前記OCRフォーマ
    ットパラメータ形成手段は、上記選択されたデータ入出
    力フォームのフォームパラメータ及び印刷手段の特性デ
    ータに従ってOCR制御情報を形成することを特徴とする
    特許請求の範囲第1項記載の情報処理システム。
JP60152209A 1985-07-12 1985-07-12 情報処理システム Expired - Lifetime JPH07107695B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60152209A JPH07107695B2 (ja) 1985-07-12 1985-07-12 情報処理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60152209A JPH07107695B2 (ja) 1985-07-12 1985-07-12 情報処理システム

Publications (2)

Publication Number Publication Date
JPS6214278A JPS6214278A (ja) 1987-01-22
JPH07107695B2 true JPH07107695B2 (ja) 1995-11-15

Family

ID=15535450

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60152209A Expired - Lifetime JPH07107695B2 (ja) 1985-07-12 1985-07-12 情報処理システム

Country Status (1)

Country Link
JP (1) JPH07107695B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03134784A (ja) * 1989-10-20 1991-06-07 Hitachi Ltd 光学読取装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56137480A (en) * 1980-03-28 1981-10-27 Nec Corp Format input device
JPS588385A (ja) * 1981-07-06 1983-01-18 Fujitsu Ltd Ocr帳票の読取位置指定方式
JPH0648489B2 (ja) * 1983-03-10 1994-06-22 富士通株式会社 光学文字読取装置

Also Published As

Publication number Publication date
JPS6214278A (ja) 1987-01-22

Similar Documents

Publication Publication Date Title
US4937439A (en) Method and system for creating and scanning a customized survey form
KR100228321B1 (ko) 문자데이타 입력 시스템
WO1991006057A1 (en) Image display/processing method of formatted document and apparatus therefor
JPS63618A (ja) ワ−ドプロセツサ
JP2003018393A (ja) 画像処理システム
JP2003108331A (ja) データ変換方法、プログラム及び記録媒体
CN116682118A (zh) 一种古文字识别方法、系统、终端及介质
JPH07107695B2 (ja) 情報処理システム
JP2974346B2 (ja) 漢字処理装置
JPH11203412A (ja) 文書画像処理装置、文書画像処理方法及び文書画像処理プログラムを記録したコンピュータ読み取り可能な記録媒体
US5481663A (en) Word processors for performing an automatic layout process
JP2682873B2 (ja) 表形式文書の認識装置
JP3029822B2 (ja) 文書処理装置、文書処理方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH0520494A (ja) 帳票属性認識・表示方法
JP2004164376A (ja) 識別コード添付帳票、帳票読取プログラム、及び帳票作成プログラム
JP3275629B2 (ja) レイアウト修正装置
US7302641B1 (en) Information processing method and apparatus for making document
JPH0743726B2 (ja) 画像処理装置
JPH0981648A (ja) 帳票作成システム及び帳票作成システムに適用する帳票作成方法
JP2000339405A (ja) 光学的文字認識システム、同システムに於ける帳票のフォーマットコントロール作成方法、及び同方法が格納された記憶媒体
JPH10340314A (ja) 帳票処理システム、その文字認識方法およびその記録媒体
JPS61100873A (ja) 光学文字/図形読み取り装置
JP2000163271A (ja) 情報処理方法および装置
JPH0789361B2 (ja) 帳票登録装置
JPH01169569A (ja) 文書作成装置に於ける文章推敲方法

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term