JPH0652156A - 文書処理方法及び装置 - Google Patents

文書処理方法及び装置

Info

Publication number
JPH0652156A
JPH0652156A JP5156561A JP15656193A JPH0652156A JP H0652156 A JPH0652156 A JP H0652156A JP 5156561 A JP5156561 A JP 5156561A JP 15656193 A JP15656193 A JP 15656193A JP H0652156 A JPH0652156 A JP H0652156A
Authority
JP
Japan
Prior art keywords
document
frame
item
characters
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5156561A
Other languages
English (en)
Other versions
JPH07109610B2 (ja
Inventor
Yasuaki Nakano
康明 中野
Hiromichi Fujisawa
浩道 藤沢
Kunihiro Okada
邦弘 岡田
Osamu Kunisaki
修 国崎
Toshitsugu Ozaki
俊従 尾崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP5156561A priority Critical patent/JPH07109610B2/ja
Publication of JPH0652156A publication Critical patent/JPH0652156A/ja
Publication of JPH07109610B2 publication Critical patent/JPH07109610B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 入力文書の構造を自動的に理解して文書の書
式を自動的に生成する。 【構成】 文字を記入していない文書のディジタル画像
を画像ファイルから読み出し、文書のディジタル画像か
ら枠ならびに枠の間の関係を抽出し、さらに枠内部に存
在する文字を認識して、知識と照合して枠部分と識別し
た文字とから画像の構造を理解することにより、自動的
に文書の書式情報の登録を行うものである。さらに、文
書中の枠部分に代えて、罫線を検出し、罫線の上方領域
の文字を切り出して画像の構造を理解し、書式情報の登
録を行なう。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は文書処理方法及び装置に
係り、特に表形式の文章上の文字を読み取る目的に好適
な文書処理方法及び装置に関する。
【0002】
【従来の技術】従来の文字読み取り装置(以下、OCR
と略する)では、読み取り領域をOCRが感じない色
(ドロップアウトカラー)を用いて印刷する必要があ
り、印刷費用が高価になる問題があった。さらに文字読
み取り領域の位置を文書のエッジからの距離として記述
し、その領域の文字数や文字種・チェック方法などを指
定する必要があり、煩雑であった。以下、文字読み取り
領域の位置情報や領域内の文字数や文字種・チェック方
法などの情報を書式情報と呼ぶ。文字認識機能は従来の
ように専用OCRだけでなく、文書ファイルやOA用ワ
ークステーションなどにも要求されているが、上記の問
題点が広い普及を阻んでいた。
【0003】従来技術では、たとえば公開特許公報昭和
58−207184号(昭和58年12月2日公開)に
おいて、入力画像からあらかじめメモリ内に格納してお
いた定形的な画像を除去する方法、ならびに定形的な画
像を用いて文書の種類を識別する方法が開示されてい
る。しかし、この方法ではメモリに画像を記憶するので
メモリ量が増大し、また文書の変形(伸縮・回転・位置
ずれなど)が生じたとき正しく除去できないおそれがあ
った。
【0004】
【発明が解決しようとする課題】本発明の目的は、入力
文書の構造を自動的に理解して文書の書式を自動的に生
成することにより、対象文書の範囲を大幅に拡大すると
ともに、書式情報作成の手間を簡略化する手段を提供す
ることにある。
【0005】本発明の他の目的は、定形的な入力文書の
種類を自動的に識別してあらかじめ記憶した書式情報を
用いることにより、種類の異なる定形的な文書の連続読
み取りを可能とする手段を提供することにある。
【0006】
【課題を解決するための手段】かかる目的を達成するた
めに、本発明においては識別対象文書と同種で、まだ文
字を記入していない文書(以下、これを見本文書と呼
ぶ)を用い、見本文書の画像から枠部分ならびに枠部分
の間の関係を抽出し、さらに枠の内部に存在する文字を
識別して枠部分と識別した文字とから画像の構造を理解
することにより、自動的に識別対象文書の書式情報の決
定を行うものである。特に、本発明では、見本文書を直
接光電変換する場合ではなく、画像ファイルから読み出
すことを特徴とする。
【0007】さらに、文書中の枠部分に代えて、罫線を
検出し、罫線の上方領域の文字を切り出して画像の構造
を理解し、書式情報の登録を行なうことも特徴とする。
【0008】
【実施例】以下、本発明を図面を用いて詳細に説明す
る。
【0009】図1は本発明を実施する装置の構成を示す
ブロック図である。装置の各部はバス1に接続され、全
体の動作は制御部2により制御される。文書3上の情報
(文や書画像)は光電変換装置4により走査され、さら
にディジタル化され、バス1を介してメモリ51に格納
される。メモリ51は後述する52,53,54ととも
にメモリ5の一部をなす。ディジタル化の際、公知の高
効率符号化処理を行ってもよく、これにより文書画像を
記憶するメモリの記憶容量を節約できる。また、以下の
説明では1画素1ビットに二値化するものとするが、1
画素を多値で表現してもよく、カラースキャナにより光
電変換して色情報を付与してもよい。
【0010】文書の処理には登録モードと識別モードと
がある。モードの選択はキーボード6、ディスプレイ7
を用いて制御部2とマンマシン対話により行う。まず、
登録モードの場合を説明する。登録モードの処理の流れ
図を図2に示す。この処理は制御部2のソフトウェアに
より実行される。図2で、201は見本文書画像の入力
であり、各文書類型ごとに見本文書を用い、この見本文
書上の画像をメモリ51の中に格納する。202では見
本文書画像に対し位置補正処理、傾き補正処理などの正
規化を行い、その結果得られる画像がメモリ52に格納
される。この正規化画像に対し、203で線抽出処理が
行われ、抽出された線パターンはメモリ53に格納され
る。図3は線パターン抽出の処理内容を説明する図であ
り、(A)のような入力画像から水平方向の線抽出によ
り(B)のような水平線パターンを得、同様に(A)か
ら垂直方向の線抽出により(C)のような垂直線パター
ンを得、(B)と(C)との論理和により(D)のよう
な画像を得る。以後(D)を線パターンと呼ぶ。線パタ
ーン抽出処理の詳細については後述する。204では線
パターンから輪郭抽出により輪郭上の座標点列を抽出す
る。この座標点列は輪郭の個数だけ得られる。以下では
輪郭の中で内輪郭だけを処理する。ここで内輪郭とは白
地を取り囲む黒地の境界であり、白地を右側に黒地を左
側に見るようにして輪郭を一周したとき時計回りに一周
するような輪郭を言う。205ではこの内輪郭の中から
長方形をなすものを抽出する。長方形判定の詳細につい
ては後述する。以後長方形をなす内輪郭を枠と呼ぶ。2
06では枠の4隅の座標を用いて枠の順序を左上から右
下へと並べ換える。207では抽出した枠が複数個あっ
たとき、枠の間の相互関係すなわち枠mと枠nの間の関
係コードCmnを抽出する。関係コードCmnの定義の
例を次に示す。
【0011】Cmn= 0:以下の条件が全て不成立 = 1:mがnを包含 =−1:nがmを包含 = 2:mがnの直上 =−2:mがnの直下 = 3:mがnの直左 =−3:mがnの直右 = 4:mがnの上方 =−4:mがnを下方 = 5:mがnの左方 =−5:mがnの右方 208では抽出した枠に対応する領域の画像を原画像か
ら取り出し、順次この画像を文字認識部8に送って枠内
の文字を認識する。枠内部の画像のみを文字認識部に送
るので非ドロップアウトカラーの表部分や枠外の不用部
分に妨害されることがなく、また帯状領域を対象とする
ので文字の切り出し・認識が容易である。全ての枠の中
の文字を認識した後209では枠mの中の認識文字数N
m、文字列Km、関係コードCmnとを文書の構造に関
する知識と照合して、入力文書の構造を理解する。知識
は「if〜then〜」形式、すなわち条件と結論とに
より表現される。知識の例を次に示す。a,b,cは枠
番号を示す。
【0012】 1.(条件)Ka=’申請書’ (結論)枠aは項目枠 枠aの項目名称=’申請書’ 2.(条件)Na=0& Kb=’申請書’& Cab=−3 (結論)枠aは枠bに従属するデータ枠 枠aの属性=’氏名’ (Na=0は空白を示す) 3.(条件)Na=0& Kb=’都道府県’& Cab=−4 Kc=’本籍’& Cac=−3 (結論)枠aは枠b,cに属するデータ枠 枠aの属性=’住所:都道府県’ 4.(条件)Ka=’昭和年月日’ (結論)枠aは独立なデータ枠 枠aの単位名称=’日時’ 枠aの属性=’時間:年月日’ 5.(条件)Na=0 (結論)枠aは独立な項目・データ枠 枠aの項目名称=’雑’ 枠aの属性=’雑’ ここで項目枠とは見出しとして使われる枠で、普通はデ
ータが記入されない。データ枠とは項目の内容を表す文
字(文字列)が記入される予定の枠をいい、属性とはそ
の枠に記入される文字の種類や限定範囲などをいう。上
記の知識の具体的な実現法はプログラムの「if〜then
〜」文としてかかれたサブルーチンであり、知識との照
合はa,bのところにm,nを代入し、条件で成立する
か否かを調べた結果を外部に引数として与えればよい。
条件が成立したときは結論も引数として外部に与える。
知識たとえば1.の条件のa,bにあてはまる枠番号
m,nが見出されたとすれば、結論の枠番号aのところ
に枠番号mを代入したものを入力文書の構造データとし
て登録する。構造データは上記の枠の関係コード、枠の
種類(項目枠、データ枠あるいは両者)、従属関係、項
目名称、属性コードとからなる。複数の知識に該当する
場合には、一例として出現順序の早い知識を優先させる
と決めればよい。最も優先度の低い知識として他の知識
にあてはまらないときの救済装置(上記の場合は5.)
を決めておけば、すべての枠についての構造が決定され
る。すべての枠について知識との照合が行われ構造が決
定されると、構造データの登録が終了し、210で構造
データ及び枠の物理データ(枠の4隅の座標など)、マ
スクデータを出力装置9に書き出す。マスクデータと
は、データ枠の中にあらかじめ印刷された文字(上記の
4.における昭和年月日などの単位名称に相当)の位置
を示すものである。構造データ、枠の物理データ、マス
クデータは従来のOCRの書式データに相当する。書き
出しに際してキーボード6、ディスプレイ7を用いて、
入力文書に対する識別番号やファイル名称を入力する。
【0013】次に線パターン抽出処理の詳細を説明す
る。図4は、線パターンを抽出する処理をPAD形式で
示す流れ図である。線パターン抽出には水平線抽出と垂
直線抽出とがあるが、ここでは水平線抽出について述
べ、垂直線抽出については同様であるので省略する。図
4で401は線抽出への入り口であり、メモリ52に格
納されている正規化画像Qが与えられる。Qは図3
(A)のような二次元データ Q(i,j),(i=0〜I−1,j=0〜J−1) として表現される。402では403〜409の処理を
走査線番号jについて繰り返すことにより、図3(B)
のような二次元パターンA(i,j)を得る。403は
初期化でありA(i,j)を0にクリアし後述するBを
0とする。404は走査線の中で画素数Iだけ繰り返す
ループである。405はQ(i,j)が1か0かを判定
し、1の場合には406で黒の連長Bをカウントする。
Q(i,j)が0の場合には、407の判定によりその
前の画素までの連長Bが閾値εより大きいとき、408
で A(i−B,j)〜A(i−1,j) のB個の画素を1(黒)にする処理を行い、409で連
長Bをリセットする。410〜411の処理は走査線の
最終点(i−I−1)において407以降と同様の処理
を行うものである。407の判定を加えたことにより十
分長い黒の水平線分があるときのみ線抽出が行われる
が、文書上に記入されている文字・記号は短い線分から
なっているのでほとんど抽出されない。412はこの処
理の出口であり、パターンA(i,j)を出力に与え、
メモリ53に格納する。以上の説明から分かるように、
パターンA(i,j)は線分の存在を反映したパターン
である。
【0014】次に長方形抽出処理の詳細を説明する。図
5は、長方形を抽出する処理の内容を示す図である。内
輪郭の座標は一次元データX(i),Y(i)として表
現される。輪郭点の中で(X(i)+Y(i))の最大
値と最小値、(X(i)−Y(i))の最大値と最小
値、を与える点を求めればこちらは図5のP4,P2,
P3,P1に相当する。P1〜P4は枠が長方形の場合
には4隅の点になる。P1〜P2の間でXの最大値と最
小値を与える点を求めこれをQ12,Q11とする。P
2〜P3の間でYの最大値と最小値を与える点を求めこ
れをQ22,Q21とする。他の辺についても同様にす
る。P1,P11,Q12,P2の4点のX座標値の差
が小さいとき、P1〜P2は直線であると判定し、他の
3辺についても同様に直線判定を行い、4辺が直線であ
るときこの枠は長方形であると判定をする。
【0015】次に関係コーデ抽出処理の詳細を説明す
る。図6は、関係コードを抽出する処理をPAD形式で
示す流れ図である。図6で601は入り口であり、メモ
リ52に格納されている枠の4隅の座標及び輪郭長Rが
与えられる。枠mの4隅を (X1(m),Y1(m))〜(X4(m),Y4(m)) とする。602,603は枠番号m,nに関する二重ル
ープである。604でCmnに初期値0を入れる。60
5の条件は枠mがnを包含することを検出し、条件が成
立するときはCmnに1を、Cnmに−1を代入する。
以下同様に関係コードを判定する。606は出口で関係
コードからなる行列Cを出力に与える。
【0016】以上で登録モードの説明を終了する。この
登録モード処理はあらかじめ行って構造データ等の書式
情報を格納しておくものとするが、次に述べる識別モー
ド処理と統合して行うことも可能である。
【0017】次に識別モードにける入力対象文書の処理
について説明する。図7に識別モードの処理の流れ図を
示す。701は入力文書の画像の取り込み、702は正
規化、703は線パターンの抽出、704は輪郭抽出、
705は長方形抽出、706は枠順序付け、707は関
係コード抽出であり、図2の202〜207と同様であ
る。708では見本文書の構造データ及び物理データを
順次メモリ53に読みだし、メモリ54の入力文書の構
造データ及び物理データと比較し、入力文書がどの見本
文書と一致するかを決定する。この見本文書の構造デー
タ及び物理データを用いて入力文書の読み取り以下のよ
うにして行う。709は枠について以下の710〜71
7を繰り返し実行するループである。710はデータ枠
についてのみ読み取りを行う判定である。711ではこ
のデータ枠の内部の領域だけを抽出する。712ではマ
スクデータによりあらかじめ印刷された文字を消去する
(マスクデータが存在するときのみ行う)。713では
属性コードにより定まる字種を選択し、認識辞書(文字
認識のための標準パターン)を設定する。714では枠
内部の文字を認識する。715では属性コードにより定
まる単語辞書を選択し、716で単語照合を行って文字
認識結果の誤読あるいは不読を修正する。717では文
字認識結果と構造データ中の必要な部分を編集し、出力
装置9に書き出す。編集の例として、たとえば、データ
枠の属する項目枠の項目名称が「申請者」であり(前記
知識の2.に相当)、この枠の認識結果が、‘山田太
郎’であったとすれば、 ‘申請者’=‘山田太郎’ のようにし、これを1レコードとして書き出す。また、
独立な項目枠・データ枠で項目名称=‘日時’、単位名
称=‘昭和年月日’であり(知識4.に相当)単位名称
の部分がマスクデータにより消去されたため、認識結果
が58529だったとすれば、編集出力は ‘日時’=‘昭和58年5月29日’ とする。後者の例では認識部8から文字の位置座標を取
り出し、マスクデータと座標の比較により位置を決定し
て編集する。
【0018】以上本発明の一実施例について説明した。
本実施例に対して通常の文字認識装置や図形処理装置で
行われる処理、たとえば枠の抽出結果の表示・修正、文
字認識結果の表示・修正などを付加することは容易に想
像されよう。また、枠認識に際して線抽出や長方形決定
の閾値を複数個設け、自動判定の結果が困難なときはマ
ンマシン的に最適値を選択したり、二値化レベルを変え
て再試行うなどの変更を加えてもよい。さらに、識別モ
ードにおいて文書の種類があらかじめ決まっている場合
はキーボードから見本文書の番号を与えるようにして、
構造データなどの照合を省略してもよい。
【0019】なお、本実施例では文書から線パターンを
抽出し、それから枠を抽出するとしたが原文書パターン
から直接輪郭を抽出し、それから枠を抽出するようにす
ることも可能であり、この場合には枠以外の輪郭を後で
他の処理たとえば文字切り出しや文字認識に利用でき
る。
【0020】また、本実施例では文書構造の記述して枠
形式のものに限定したが、実線あるいは破線などの罫線
や、円などを用いるように拡張することも可能である。
たとえば実線かならる罫線は、細長い外輪郭を抽出する
ことで検出でき、罫線の上方の領域を切り出すことによ
って下線を引いた表題文字の認識が可能である。円の検
出は輪郭座標系列を極座標表示し、この空間で直接検出
すればよい。
【0021】また、枠の外部の文字も読み取って、構造
記述に利用することもできる。色情報を利用し構造記述
に色属性を付加することも有効である。
【0022】さらに、文書から直接光電変換する場合に
限定せず、画像ファイルから読み出した文書画像に対し
ても適用できる。
【0023】
【発明の効果】以上説明したごとく、本発明によれば入
力文書の構造を自動的に理解して文書の書式を自動的に
生成することが可能で、従来のように人間による書式情
報の作成作業が不要であり、黒色で印刷された表形式の
文書が読み取れるのでドロップアウトカラーで印刷し直
す必要がなく、準備作業の手間を簡略化できるととも
に、対象文書の範囲を大幅に拡大することができる。
【0024】また本発明によれば、定形的な入力文書の
種類を自動的に識別してあらかじめ記憶した書式情報を
用いることができ、異なる種類の定形的な文書の連続読
み取りが可能となる。
【図面の簡単な説明】
【図1】本発明の実施例を示す図である。
【図2】図1の制御部における処理を説明するための流
れ図である。
【図3】図2における処理内容を説明する図である。
【図4】図1の制御部における処理を説明するための流
れ図である。
【図5】図2における処理内容を説明する図である。
【図6】図1の制御部における処理を説明するための流
れ図である。
【図7】図1の制御部における処理を説明するための流
れ図である。
【符号の説明】
1…バス、2…制御部、3…文書、5…メモリ、6…キ
ーボード、7…ディスプレイ、8…文字認識部、9…出
力装置。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 岡田 邦弘 神奈川県横浜市戸塚区吉田町292番地 株 式会社日立製作所マイクロエレクトロニク ス機器研究所内 (72)発明者 国崎 修 神奈川県横浜市戸塚区吉田町292番地 株 式会社日立製作所マイクロエレクトロニク ス機器研究所内 (72)発明者 尾崎 俊従 神奈川県小田原市国府津2880番地 株式会 社日立製作所小田原工場内

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】文字と枠を有し、上記枠は少なくとも項目
    の文字が記入された項目枠と上記項目の内容を表す文字
    が記入される予定のデータ枠を含む文書のディジタル画
    像を画像ファイルから読み出し、 上記ディジタル画像から線パターンを抽出して上記文書
    中の複数の枠を抽出し、 抽出した上記複数の枠の間の関係を記述し、 抽出した上記複数の枠に対応する領域内部に存在する文
    字を上記ディジタル画像から取り出して認識し、 少なくとも文書に関する項目枠とデータ枠の情報、項目
    枠とデータ枠との関係、および枠内部に記入された文字
    を文書の構造に関する知識として記憶し、抽出した上記
    複数の枠の情報、記述した上記複数の枠の間の関係、お
    よび認識した上記文字と、記憶した上記知識とを照合し
    て上記文書の構造を理解し、 理解した結果に基づき、上記文書の構造を書式情報とし
    て登録する、 ことを特徴とする文書処理方法。
  2. 【請求項2】請求項1記載において、上記文書を見本文
    書としてその書式情報を登録し、データ枠に項目の内容
    を表す文字が記入された文書を入力し、上記見本文書の
    書式情報を用いて、入力した上記文書のデータ枠に記入
    された文字を認識することを特徴とする文書処理方法。
  3. 【請求項3】請求項1記載において、上記文書を見本文
    書としてその書式情報を登録し、登録した上記書式情報
    を外部の記憶装置に出力することを特徴とする文書処理
    方法。
  4. 【請求項4】請求項1記載において、抽出した上記複数
    の枠、および認識した上記文字の少なくともいずれかを
    表示し、修正を行なうことを特徴とする文書処理方法。
  5. 【請求項5】文字と枠を有し、上記枠は少なくとも項目
    の文字が記入された項目枠と上記項目の内容を表す文字
    が記入される予定のデータ枠を含む文書のディジタル画
    像を記憶する画像ファイルと、 上記ディジタル画像から線パターンを抽出して上記文書
    中の複数の枠を抽出する手段と、 抽出した上記複数の枠の間の関係を記述する手段と、 抽出した上記複数の枠に対応する領域内部に存在する文
    字を上記ディジタル画像から取り出して認識する手段
    と、 少なくとも文書の項目枠とデータ枠の情報、項目枠とデ
    ータ枠との関係、および枠内部に記入された文字を予め
    文書の構造に関する知識として記憶する手段と、 抽出した上記複数の枠の情報、記述した上記複数の枠の
    間の関係、および認識した上記文字と、記憶した上記知
    識とを照合して上記文書の構造を理解する手段と、 理解した結果に基づき、上記文書の構造を書式情報とし
    て登録する手段と、 を有することを特徴とする文書処理装置。
  6. 【請求項6】文字と罫線を有し、上記罫線は少なくとも
    項目の文字が記入された項目罫線と上記項目の内容を表
    す文字が記入される予定のデータ罫線を含む文書のディ
    ジタル画像を光電変換して入力するか画像ファイルから
    読み出し、 上記ディジタル画像から線パターンを抽出して上記文書
    中の複数の罫線を抽出し、 抽出した上記複数の罫線の間の関係を記述し、 抽出した上記複数の罫線に対応する上方領域に存在する
    文字を上記ディジタル画像から取り出して認識し、 少なくとも文書に関する項目罫線とデータ罫線の情報、
    項目罫線とデータ罫線との関係、および罫線上方に記入
    された文字を文書の構造に関する知識として記憶し、抽
    出した上記複数の罫線の情報、記述した上記複数の罫線
    の間の関係、および認識した上記文字と、記憶した上記
    知識とを照合して上記文書の構造を理解し、 理解した結果に基づき、上記文書の構造を書式情報とし
    て登録する、 ことを特徴とする文書処理方法。
JP5156561A 1993-06-28 1993-06-28 文書処理装置 Expired - Lifetime JPH07109610B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5156561A JPH07109610B2 (ja) 1993-06-28 1993-06-28 文書処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5156561A JPH07109610B2 (ja) 1993-06-28 1993-06-28 文書処理装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP59180517A Division JPH07107694B2 (ja) 1984-08-31 1984-08-31 文書処理装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP6229222A Division JP2544589B2 (ja) 1994-09-26 1994-09-26 文書処理方法及び装置

Publications (2)

Publication Number Publication Date
JPH0652156A true JPH0652156A (ja) 1994-02-25
JPH07109610B2 JPH07109610B2 (ja) 1995-11-22

Family

ID=15630486

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5156561A Expired - Lifetime JPH07109610B2 (ja) 1993-06-28 1993-06-28 文書処理装置

Country Status (1)

Country Link
JP (1) JPH07109610B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008083988A (ja) * 2006-09-27 2008-04-10 Casio Comput Co Ltd 入力フォーム作成装置及びプログラム
CN112733855A (zh) * 2020-12-30 2021-04-30 科大讯飞股份有限公司 表格结构化方法、表格恢复设备及具有存储功能的装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56137480A (en) * 1980-03-28 1981-10-27 Nec Corp Format input device

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56137480A (en) * 1980-03-28 1981-10-27 Nec Corp Format input device

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008083988A (ja) * 2006-09-27 2008-04-10 Casio Comput Co Ltd 入力フォーム作成装置及びプログラム
CN112733855A (zh) * 2020-12-30 2021-04-30 科大讯飞股份有限公司 表格结构化方法、表格恢复设备及具有存储功能的装置
CN112733855B (zh) * 2020-12-30 2024-04-09 科大讯飞股份有限公司 表格结构化方法、表格恢复设备及具有存储功能的装置

Also Published As

Publication number Publication date
JPH07109610B2 (ja) 1995-11-22

Similar Documents

Publication Publication Date Title
JPH07107694B2 (ja) 文書処理装置
US4933979A (en) Data reading apparatus for reading data from form sheet
US6208744B1 (en) Document image processor and method for setting a document format conforming to a document image
US5235653A (en) Document analysis system
JP3294995B2 (ja) 帳票読取装置
JP3001065B2 (ja) プログラムの作成方法
JP4935459B2 (ja) 文字認識方法、文字認識プログラムおよび文字認識装置
JP3215176B2 (ja) 文書画像処理装置及び文書画像処理方法
JP2544589B2 (ja) 文書処理方法及び装置
JPH0652156A (ja) 文書処理方法及び装置
JP3435375B2 (ja) 文字認識方法および装置
JPH08329187A (ja) 文書読取装置
JP3276555B2 (ja) フォーマット認識装置及び文字読取り装置
JP3309084B2 (ja) 図形の電子化方法
JPS61193281A (ja) 文書入力方式
JPH0789361B2 (ja) 帳票登録装置
JPH0252329A (ja) 画像情報記録・読取方法
JP2556476B2 (ja) 識別子登録方法
JPH07262317A (ja) 文書処理装置
JPS61193275A (ja) 文書入力方式
JP3276554B2 (ja) フォーマット認識装置及び文字読取り装置
JP2682873B2 (ja) 表形式文書の認識装置
JPS63155385A (ja) 光学文字読取装置
JP2954218B2 (ja) 画像処理方法及び装置
JP2931485B2 (ja) 文字切出し装置及び方法

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term