JPS61193275A - 文書入力方式 - Google Patents

文書入力方式

Info

Publication number
JPS61193275A
JPS61193275A JP60032619A JP3261985A JPS61193275A JP S61193275 A JPS61193275 A JP S61193275A JP 60032619 A JP60032619 A JP 60032619A JP 3261985 A JP3261985 A JP 3261985A JP S61193275 A JPS61193275 A JP S61193275A
Authority
JP
Japan
Prior art keywords
frame
document
memory
image
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60032619A
Other languages
English (en)
Inventor
Kunihiro Okada
邦弘 岡田
Yasuaki Nakano
中野 康明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP60032619A priority Critical patent/JPS61193275A/ja
Publication of JPS61193275A publication Critical patent/JPS61193275A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は、表形式の文書上の文字を読み取る目的に好適
な文書処理方式における枠構造の抽出、確認手段に係シ
、特に書式全自動的に生成する場合に好適な発明に関す
る。
〔発明の背景〕
従来の文字読み取シ装fit(以下、OCRと略する)
では、読み取シ領域’tOcRが感じない色(ドロップ
アウトカラー)t−用いて印刷する必要がめり、印刷費
用が高価になる問題があった。さらに文字読み取シ領域
の位置を文書のエツジからの距離として記述し、その領
域の文字数や文字種・チェック方法などを指定する必要
がロシ、煩雑であった。以下、文字読み取シ領域の位置
情報や領域内の文字数や文字種・チェック方法などの情
報を書式情報と呼ぶ。文字認識機能は従来のように専用
OCRだけでなく、文書ファイルやOA用ワークステー
ションなどにも要求されているが、上記の問題点が広い
普及を阻んでいた。
従来技術では、たとえば公開特許公報昭和58−207
184号(昭和58年12月2日公開)において、入力
画像からあらかじめメモリ内に格納しておいた定形的な
画像を除去する方法、ならびに定形的な画像を用いて文
書の種類を識別する方法が開示されている。しかし、こ
の方法ではメモリに画像を記憶するのでメモリーが増大
し、また文書の変形(伸縮・回転・位置ずれなど)が生
じたとき正しく除去できないおそれがあった。かかる問
題点を解決する手段として入力文書の構造を自動的に理
解して文書の書式を自動的に生成することにより、対象
文書の範囲を拡大し、書式情報作成の手間を簡略化する
手段t−特願昭59−180517に開示したが、枠の
認識を誤った場合に゛誤って登録されてしまうなどの問
題があった。
〔発明の目的〕
本発明の目的は入力文書の構造を自動的に理解して文書
の書式を自動的に生成する手段において枠構造の抽出を
確実になし得る手段を提供することにある。
〔発明の概要〕
かかる目的を達成するために、本発明においては識別対
象文書の画像から枠部分を抽出し、枠として不確実な枠
が表われた時にこれを候補枠としてディスプレイ上に表
示し、マンマシン対話により除去または登録することに
よって枠構造の抽出を確実にするとともに、枠構造tg
識して枠に番号付けをし、番号の付いた枠と、6粋に対
応した文字認識結果を表示することによって帳票の書式
認識f:確実にするものである。
〔発明の実施例〕
以下、本発明を図面を用いて詳細に説明する。
第1図は本発明の文書理解方式を実施する装置の構成を
示すブロック図である。装置の各部はバスlに接続され
、全体の動作は制御部2によシ制御される。文書3上の
情報(文畳画像)は光電変換装置4によシ走査され、さ
らにディジタル化され、バスlを介してメモリ51に格
納される。メモリ51は後述する52,53.54とと
もにメモリ5の一部をなす。ディジタル化の際、公知の
高効率符号化処理を行ってもよく、これによシ文書画像
を記憶するメモリの記1容量を節約できる。
また、以下の説明では1画素1ビツトに二値化するもの
とするが、1画素を多値で表現してもよく、カラースキ
ャナによシ光電変換し上包情報を付与してもよい。
文書の処理には登録モードと識別モードとがある。□モ
ードの選択はキーボード6、ディスプレイ7を用いて制
御部2とマンマシン対話によシ行う。
まず、登録モードの場合を説明する。登録モ―ドの処理
の流れ図′f!:第2図に示す。この処理は制御s2の
ソフトウェアによシ実行される。第2図で、201は見
本文書画像の入力であシ、各文書類聾どとに見本文書を
用い、この見本文書上の画像をメモ′す51の中に格納
する。202では見本文書画像に対し位置補正処理、傾
き補正処理などの正規化を行い、七の結果得ら几る画像
がメモリ52に格納される。この正規化画像に対し、2
03で線抽出処理が行われ、抽出された線パターンはメ
モリ53に格納される。第3図は線パターン抽出の処理
内容を説明する囚であシ、(A)のような入力画像から
水平方向の線抽出によ!1)(B)のような水平線パタ
ーンを得、同様に(A)から垂直方向の線抽出によjl
) (C)のような垂直線パターンを得、(B’)と(
C)との論理和によシ(D)のような画像を得る。以後
(D)t−線パターンと呼ぶ。線パターン抽出処理の詳
細については後述する。204では線バi−ンから輪郭
抽出によ〕輪郭上の座標点列を抽出す為。この座標点列
は輪郭の例数だけ得られる。以下では輪郭の中で内輪郭
だけを処理する。ここで内輪郭とは白地を取)囲む黒地
の境界であシ、白地を右側に黒地を左側に見るようにし
て輪郭を一周したとき時計回シに一周するような輪郭を
言う。205ではこの内輪郭の中から長方形をなす本の
を抽出する。長方形判定の詳細については後迷子る。以
後長方形をなす内輪郭を枠と呼ぶ。20′6では枠の4
隅の座標を用いて枠の順序を左上から右下へと並べ換え
、枠に番号(枠番号)t一つける。このようにして抽出
した長方形は、例えば帳票が傾いて光電変換装置4に入
力されると、第3図(E)に示すように実際の長方形P
IF2P3より細<PIP2’P3P4’のように抽出
される場合かめる。
−1後述するように線抽出の際のノイズを防ぐために、
抽出すべき線長に最小値を設定するが、線分PIP2’
 、P3P4’がこの最小値に近い値の時には、これを
無条件に長方形とすると文字等の線分を含めたり、又は
逆に無条件に捨て去ると必要な長方形をおとした9して
、枠構造の抽出が不正確になる。同様に第3図(F)の
ように長方形の任意の辺が切断される場合も有る。そこ
で抽出した枠構造をディスプレイ7に表示し、1じ正の
有無を確認する。まず長方形の判定に曖昧性を持たせ、
長方形と決定出来ない枠については候補枠として枠表示
の際に他の枠と異なる色や破線による表示、または枠の
中あるいは周辺に候補枠であることを示す記号を付して
例えば第4因の如く表示する。セして表示された枠構造
を見て枠と認められる候補枠又は認められない候補枠に
対して登録又は削除の応答をキーボード6を介して行な
う。
さらにまた存在しない枠や、抜けてしまった枠が有る場
合には再試行を行なわせるようにキーボードを介してメ
ツセージを入力する。
次に抽出した枠が複数11iliIあったとき、枠の間
の相互関係すなわち枠mと枠nの間の関係コードCm 
n f抽出207でする。関係コードCmnの定義の例
を次に示す。
Cmn=0:以下の条件が全て不成立 = 1:mがnを包含 =−IHnがmを包含 = 2:mがnの直上 =−2Hmがn (1)直下 = 3:mがnの直圧 =−3;mがn (1)直左 = 4二mがnの上方 =−4:mがnt−下方 = 5二mがnの左方 =−5二mがnの右方 208では抽出した枠に対応する領域の画像を原画像か
ら取シ出し、順次この画像を文字認識部8に送って枠内
の文字を認識する。枠内部の画像のみを文字g織部に送
るので非ドロップアウトカラーの表部分や枠外の不用部
分に妨害されることがなく、また帯状領域を対象とする
ので文字の切シ出し・認識が容易である。全ての枠の中
の文字を認識した後209では枠mの中の認識文字数N
m1文字列Km%関係コードCm nとを文書の構造に
関する知識と照合して、入力文書の構造を理解する。知
識は「if%then〜」形式、すなわち条件と結論と
により表現される。知識の例を次に示す。
a、b、cは枠番号を示す。
1、(条件)Ka=−申請書” (結論)枠aは項目枠 枠aの項目名称=1申請書” 2、(条件1Na=O& Kb=”申請書”& Cab=−3 (結論)枠aは枠すに従属するデータ枠棒aの属性=1
氏名“ (Na=0は空白を示す) 3、(条件)Na=o& [b=1都道府県”& Cab=−4 KC=”本籍”& CaC=−3 (結論)枠aは枠す、cに属するデータ枠棒aの属性=
6住所二部道府県” 4、(条件) K a =1昭和年月日”(結論)枠a
は独立なデータ枠 枠aの単位名称=“日時” 枠aの属性=1時間:年月日” 5、(条件INa=0 (結論)枠aは独立な項目・データ枠 棒aの項目名称=1雑” 枠aの属性=1雑” ここで項目枠とは見出しとして使われる枠で、普通はデ
ータが記入さnない。データ枠とは項目の内容を表す文
字(文字列)が記入される予定の枠をいい、属性とはそ
の枠に記入される文字の種類や限定範囲などをいう。上
記の知識の具体的な実現法はプログラムの「if〜th
en〜」文としてかかれたサフルーチンであシ、知識と
の照合はa、bのところにm、nf代入し、条件で成立
するか否かを調べた結果を外部に引数として与えればよ
い。条件が成立したときは結論も引数として外部に与え
る。知識たとえば1.の条件のa、bにあてはまる枠番
号m、nが見出されたとすれば、結論の枠査号aのとこ
ろに枠番号mf代入したものを入力文書の構造データと
して盆碌する。構造データは上記の枠の関係コード、枠
の種類(項目枠、データ枠めるいは両者)、従属関係9
項目名称、属性コードとからなる。複数の知識に該当す
る場合には、−例として出現順序の早い知識を優先させ
ると決めればよい。最も優先度の低い知識として他の知
識にあてはまらないときの救済措置(上記の場合は5.
)を決めておけば、すべての枠についての構造が決定さ
れる。すべての枠について知識との照合が行われ構造を
決定した後、ディスプレイ7に枠と、それに付した枠番
号、および枠番号に対応した認識結果、さらに項目枠に
対応するデータ枠の枠番号を表示する。第5図に一例を
示す。ここでもし項目名称めるいはデータ枠番号に間違
いが有る場合、このまま構造データを出力装置9に書き
出すと、後述する識別モードの時の処理が誤ったものに
なる。このようなことを防止するために誤シがるる場合
にはキーボードを介して項目名称、データ枠番号の修正
を行なう。
構造データの登録が終了し、21Oで構造データ及び枠
の物理データ(枠の4隅の座標など)、マスクデータを
出力装置9に誓き出す。マスクデータとは、データ枠の
中にあらかじめ印刷された文字(上記の4.における昭
和年月日などの単位名称に相当)の位置を示すものであ
る。構造データ。
枠の物理データ、マスクデー、jIta従来のOCR,
の書式データに相当する。書き出しに際してキーボード
6、ディスプレイ7t−用いて、入力文書に対する識別
番号やファイル名称を入力する。
次に線パターン抽出処理の詳細を説明する。第6図は、
線パターンを抽出する処理をPAD形式で示す流れ図で
ある。線パターン抽出には水平線抽出と垂直線抽出とが
あるが、ここでは水平線抽出について述べ、垂直線抽出
については同様であるので省略する。第6図で601は
線抽出への入り口であり、メモリ52に格納さ几ている
正規化画像Qが与えられる。Qは第3図(A)のような
二次元データ Q(i+ J l、(x=o〜x  ts J=0〜J
  I)として表現される。602でII′1603〜
6o9の処理を走査線番号jについて繰ル返すことによ
シ、第3図(B)のような二次元パターンA(i、j)
を得る。a03は初期化でめシA(i、j)を0にクリ
アし後述するBkOとする。404は走査線の中で画素
数工だけ繰シ返すループである。
605はQ(ijj)が1か0かを判定し、lの場合に
は606で黒の遅炎Beカクントする。
Q(i、j)が0の場合には、607の判定にょシその
前の画素までの遅炎Bが閾値εニジ大きいとき、608
で A(i−B、j)〜A(i−1,j) の8個の画素を1(黒)にする処理を行い、6o9で遅
炎B’tリセットする。610〜611の処理は走査線
の最終点(i=I−11において607以降と同様の処
理2行うものでるる。607の判定を加えたことによシ
する長さ以上の黒の水平線分があるときのみ線抽出が行
われるが、文書上に記入されている文字・記号は短い巌
分からなっているのでほとんど抽出されない。612は
この処理の出口でメ)、パターンA(i、j)を出力に
与え、メモリ53に格納する。以上の説明から分かるよ
うに、パターンA(i、j)は線分の存在上反映したパ
ターンでおる。
次に長方形抽出処理の詳ak説明する。第5図は、長方
形を抽出する処理の内容を示す図である。
内輪郭の座標は一次元データX(i)、Y(i)として
表現される。輪郭点の中で(X(j)+Y(i))の最
大値と最小値、(X(i) −Y(il)の最大値と最
小値、を与える点を求めればこちらは第7図のP4.P
2.P3.Piに相当する。
PI−P4は枠が長方形の場合には4隅の点になる。P
i−P2の間でXの蛾大値と最小値を与える点を求めこ
れiQl 2.Ql lとする。P2〜P3の間でYの
最大値と最小値を与える点を求めこれ’1Q22.Q2
1とする。他の辺についても同様にする。PI、Qll
、Ql2.P2の4点のX座標値の滉が小さいと@、P
L−P2は直線であると判定し、他の3辺についても同
様に直線判定を行い、4辺が直線であるときこの枠は長
方形であると判定をする。
次に関係コード抽出処理の詳細全説明する。第8図は、
関係コードを抽出する処理をPAD形式で示す流れ図で
ある。第8図で801は入シロであり、メモリ52に格
納されている枠の4隅の座標及び輪郭長几が与えられる
。枠mの4隅を(Xi (m) 、 Yl(m) ) 
〜(X4(m) 、 Y4(ml 1とする。802,
803は枠番号m、nに関する二重ループである。80
4でQmnに初期値Oを入れる。805の条件は枠mが
nを包含することを検出し、条件が成立するときはCm
nにlft。
Cnrnに一11c代入する。以下同様に関係コードを
判定する。806は出口で関係コードからなる行列Cを
出力に与える。
以上で登録モードの説明を終了する。この登録モード処
理id、りらかしめ行って構造データ等の書式情報を格
納しておくものとするが、次に述べる識別モード処理と
統合して行うことも可能である。
次に識別モードにおける入力対象文書の処理について説
明する。第9図に識別モードの処理の流れ図を示す。9
01は入力文書の画像の取シ込み、902は正規化、9
03は線パターンの抽出、904は輪郭抽出、905は
長方形抽出、906は枠順序付け、907は関係コード
抽出でメジ、第2図の202〜207と同様である。9
08では見本文書の構造データ及び物理データを順次メ
モリ53に読みだし、メモリ54の入力文書の構造デー
タ及び物理データと比較し、入力文書がどの見本文書と
一致するかを決定する。この見本文書の構造データ及び
物理データを用いて入力文書の読み取りを以下のように
して行う。909は枠について以下の910〜917T
h繰夛返し実行するループである。910はデータ枠に
ついてのみ読み取りを行う判定である。911ではこの
データ枠の内部の領域だけを抽出する。912ではマス
クデータに二りあらかじめ印刷された文字を消去する(
マスクデータが存在するときのみ行う)。
913では属性コードによシ定まる字種を選択し、認識
辞書(文字認識のための標準パターン)を設定する。9
14では枠内部の文字を認識する。
915では属性コードによυ定まる単語辞書を選択し、
916で単語照合を行って文字認識結果の誤読あるいは
不読を修正する。917では文字認識結果と構造データ
中の必要な部分を編集し、出力装置9に書き出す。編集
の例として、たとえば、データ枠の属する項目枠の項目
名称が「申請者」でろ#)(前記知識の2.に相当)、
この枠の認識結果が1山田穴部”であったと丁れば、1
申請者”=“山田太部” のようにし、これをルコードとして書き出す。
また、独立な項目枠・データ枠で項目名称=1日時”、
単位名称=1昭和年月日”であり(知識4゜に相当)単
位名称の部分がマスクデータによシ消去されたため、認
識結果が58529だったとすれば、編集出力は 1日時”=1昭和58年5月29日” とする。後者の例では認識部8から文字の位置座標を取
シ出し、マスクデータと座標の比較によシ位置を決定し
て編集する。
〔発明の効果〕
以上説明したごとく、本発明によれば入力文書の構造を
自動的に理解して文書の書式を自動的に生成する際に人
間による確認修正作業が加わるので自動生成の精度が高
まり、従来のように人間による書式情報の長時間の作成
作業を大幅に削減でき、黒色で印刷された表形式の文書
が読み取れるのでドロップアウトカラーで印刷し直す必
要がなく、準備作業の手間を簡略化でさるとともに、対
象文書の範囲を大幅に拡大することができる。
また本発明によれば、定形的な入力文書の種類を自動的
に識別してあらかじめ記憶した書式情報を用いることが
でき、異なる種類の定形的な文書の遅続読み取りが可能
となる。
【図面の簡単な説明】
第1図は本発明の実施例を示す図、第2.6゜8.9図
は第1図の制御部における処理を説明するための流れ図
、!3,4,5.7図は第2図における処理内容を説明
する図でめる。 l・・・バス、2・・・制御部、3・・・文書、5・・
・メモリ、6・・・キーボード、7・・・ディスプレイ
、8・・・文字認識部、9・・・出力装置。 第 2 目 第 3 口 (A)          (F3) (リ              (D)りi    
3   13   (E)′   第30(F) VJ+r;a 第 3 困

Claims (1)

  1. 【特許請求の範囲】 1、文書画像を入力する手段と、上記文書画像から枠部
    分を抽出する手段と、上記枠部分の内部に存在する文字
    を識別する手段と、上記抽出した枠部分および枠構造認
    識結果を表示修正する手段とを具備したことを特徴とす
    る文書入力方式。 2、上記特許請求範囲第1項記載の文書入力方式におい
    て枠部分が曖昧に抽出された時には曖昧な枠部分に曖昧
    性を示す情報を付加し、該情報に基づいて対話的に修正
    を行なう文書入力方式。 3、上記特許請求範囲第1項記載の文書入力方式におい
    て枠部分に記号を付し、該記号に対応した部分の枠に記
    入された文字を、枠部分および上記記号に対応付け可能
    な如く表示し、該表示結果に基づき、枠構造および項目
    名称の修正を対話的に行なう文書入力方式。
JP60032619A 1985-02-22 1985-02-22 文書入力方式 Pending JPS61193275A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60032619A JPS61193275A (ja) 1985-02-22 1985-02-22 文書入力方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60032619A JPS61193275A (ja) 1985-02-22 1985-02-22 文書入力方式

Publications (1)

Publication Number Publication Date
JPS61193275A true JPS61193275A (ja) 1986-08-27

Family

ID=12363864

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60032619A Pending JPS61193275A (ja) 1985-02-22 1985-02-22 文書入力方式

Country Status (1)

Country Link
JP (1) JPS61193275A (ja)

Similar Documents

Publication Publication Date Title
JPS6159568A (ja) 文書処理装置
JP3294995B2 (ja) 帳票読取装置
JP2004258706A (ja) 帳票定義データ作成方法および帳票処理装置
JP2003018393A (ja) 画像処理システム
US6958755B1 (en) Personalized computer fonts
JP4935459B2 (ja) 文字認識方法、文字認識プログラムおよび文字認識装置
JP4807618B2 (ja) 画像処理装置及び画像処理プログラム
JPS61193275A (ja) 文書入力方式
JPH08329187A (ja) 文書読取装置
JPH10171920A (ja) 文字認識装置、その文字認識方法およびその記録媒体
JP2544589B2 (ja) 文書処理方法及び装置
JPH0652156A (ja) 文書処理方法及び装置
JP6743401B2 (ja) 帳票設計・読取設定支援装置、帳票設計・読取設定支援方法、及び、光学文字認識システム
JPH0991385A (ja) 文字認識辞書追加方法及びこれを用いた端末ocr装置
JP4081074B2 (ja) 帳票処理装置、帳票処理方法、及び帳票処理プログラム
JP2708604B2 (ja) 文字認識方法
JP2000331117A (ja) 文書読取システム
JP2005004395A (ja) 帳票、帳票処理方法、帳票処理プログラム、帳票処理プログラムを記録した記録媒体及び帳票処理装置
JPS61193281A (ja) 文書入力方式
JP2893781B2 (ja) 文字認識装置
JP2003085477A (ja) 文字認識装置および文字認識結果の訂正方法
JPH01292586A (ja) 文字認識支援装置
JPS61190676A (ja) 帳票登録装置
JPH0934988A (ja) 文字認識シートおよびその処理装置
JP2823350B2 (ja) マルチメディア入力装置