JPH03167685A - 帳票入力処理方式 - Google Patents

帳票入力処理方式

Info

Publication number
JPH03167685A
JPH03167685A JP1308081A JP30808189A JPH03167685A JP H03167685 A JPH03167685 A JP H03167685A JP 1308081 A JP1308081 A JP 1308081A JP 30808189 A JP30808189 A JP 30808189A JP H03167685 A JPH03167685 A JP H03167685A
Authority
JP
Japan
Prior art keywords
picture elements
black picture
character
image data
entry field
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1308081A
Other languages
English (en)
Inventor
Osamu Nakamura
修 中村
Tomiyoshi Sakamoto
坂本 富栄
Tadashi Kitamura
正 北村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP1308081A priority Critical patent/JPH03167685A/ja
Publication of JPH03167685A publication Critical patent/JPH03167685A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野] 本発明は,文字認識技術をヘースとして利用し手書きの
帳票を計算機に投入することのできる帳票入力処理方式
に関するものである。
〔従来の技術〕
文字認識技術を応用した光学文字読取り装置(OCR)
では,予め印刷した所定の帳票を用いる場合が多く,こ
の場合には,住所,姓名等の用語を記入する場所を指示
するために,文字や用語の単位で罫線等を用いた囲みを
印刷しておくことが一般的である.また.記入欄のイメ
ージデータ範囲を切り出す際には.記入のはみ出しを考
慮して囲みよりも広めにとる必要がある。さらに,上記
の囲みが記人文字と混在した場合,著しく文字認識性能
を低下させるため.イメージスキャナ等によって帳票を
読取る際に.囲みの部分を除去し,鉛筆等で記入した文
字部分のみがイメージスキャナによって読み取られるよ
うに,囲みを青色や黄色等のドロノプアウトカラーと呼
ばれる色を用いて印刷する場合が多い。
〔発明が解決しようとする課題〕
上記のドロンブアウトカラーを用いた帳票印刷には,印
刷のために手間.時間.費用が掛かる,イメージスキャ
ナの機種に応して最適なドロノブアウトカラ一の選択が
必要,普及しているパーソナルコンピュータのプリンタ
や複写機を使って手軽に帳票作戒ができないなどという
問題が有った.本発明は,上記の問題を解央し,パーソ
ナルコンピュータ等に接続されたプリンタや複写機によ
る帳票印刷が可能なようにすることを目的としている。
〔課題を解決するための手段〕
連続する黒画素の個数によって.文字の一部であるかノ
イズであるかを自動識別する機能によって,ノイズとは
識別され得る黒画素数を有するバタンの連なりをもって
記入欄の囲みとして印刷しておき,文字認識前に予め該
記入欄囲みを除去することを特徴としている。
〔作用] このようにすることによって,ドロップアウトカラー印
刷を行う必要がなくなり,パーソナルコンピュータ等に
接続されたプリンタや複写機による帳票印刷を実現する
ことができる。
〔実施例] 以下.本発明の一実施例について図面により説明する.
第1図は本発明の一実施例横戒.第2図は本発明に基づ
き印刷した帳票を読取る処理フロ,第3図は本発明に基
づいて印刷した帳票の例を示す図である. まず.第l図を用いて本発明の構成および原理の説明を
行う。第1図中の1から3までのブロックが帳票作或部
100の構戒を示し,5から10までのブロックが帳票
入力部200の構成を示している。1はパーソナルコン
ピュータ2 2はバーソナルコンピュータlの操作卓.
3はプリンタ,4はプリンタ3によって印刷される帳票
,5はイメージスキャナ,6はイメージスキャナ5によ
って読み取ったイメージデータから記入欄や文字の範囲
のイメージデータを切り出す記入欄文字切出し部,7は
記入欄や文字の範囲等の帳票形式を定義する帳票形式情
報,8は文字切り出しの結果得られる各文字のイメージ
データからノイズまたは本発明に基づき印刷された囲み
部分を除去するノイズ除去部.9はノイズ除去後のイメ
ージデータを文字コードに変換する文字認識部,10は
文字認識に用いられる文字辞書である。尚,第1図に示
した実施例においては,記入欄文字切出し部6によって
文字範囲の切り出しをおこなってからノイズ除去を行う
例を示したが5他の方法として.帳票形式情報7に基づ
く記入欄範囲の切り出し後に,ノイズ除去を行い.その
後に文字範囲の切り出しを行う方法も考えられる。
まず帳票作戒部100では.パーソナルコンピュータ1
上で通常のワードプロセノサ等のソフトウェアを動作さ
せて帳票ファイル(帳票様式をレイアウトした文書ファ
イル)を作威し,プリンタ3によって印刷を行う.ここ
で印刷する帳票は,後述する例えば第3図に示すような
帳票である。
印刷に用いるインクの色に対しては.本発明によれば特
に制約はない。
次に帳票入力部200における動作を説明する。
帳票作或部l00によって印刷された帳票4の記入欄内
に,鉛筆,ボールペン等の筆記具を用いて所定事項を記
入し,この記入済み帳票をイメージスキャナ5へ人力す
る。イメージスキャナ5では2帳票4全体のイメージを
読み取る。ここでイメージの読取りには各種の方法が用
いられているが例えば.印刷部分および記入部分につい
ては.1mm当り8〜12個程度の密度の黒点(黒画素
)の集合として また印刷や記入が行われていない通常
白の部分については白点(白画素)で表現する方法が一
般的である。尚,画素の密度については.使用するイメ
ージスキャナの仕様によって定められている。次に.記
入欄文字切出し部6においては,信号線16を介して送
られてくる上記の帳票4全体のイメージデータから,@
票形式情報7に基づき,記入欄部分のイメージデータの
みを切り出す。さらに,上記記入欄対応のイメージデー
タから各文字に対応するイメージデータに分割する必要
があるが,この各文字に対応するイメージデータの切り
出しについては,記入欄の囲みが1文字1文字毎になさ
れている(文字枠付きである)か否かで方法が異なる。
文字枠付きの場合には.各文字枠の位置情報が帳票形式
情報7から得られ.該情報に基づき各文字のイメージデ
ータを切り出すことができる。また.文字枠付きでない
場合には.黒画素の連なり具合いを調べ.各文字の位置
を推定する方法が一般的に行われている。
この場合の各文字位置を推定する方法には各種の方法が
提案されているが,本発明の原理には直接関係しないの
で.いずれの方法を採用しても良く,詳細な説明は省略
する.記入欄文字切出し部6からは.最終的に,各文字
に対応するイメージデータが出力されるものとする。次
にノイズ除去部8では イメージスキャナ5によるイメ
ージデータの読取り時に厘入するノイズ(通常.少数の
黒画素の集合)および本発明に基づき印刷された記入欄
の囲み(ノイズと同等)を除去する。具体的な除去の方
法については,第2図を用いて後に説明する.上記の動
作によって,ノイズ除去部8からは最終的に,記入文字
に対応するイメージデータのみが出力される.最後に,
文字認識部9では文字辞書10を用いて,イメージデー
タから文字コードへの変換を行う,ここで文字認識の方
法には.オンライン手書き文字認識用アルゴリズム(記
入時の筆順等も用いてリアルタイムに文字認識を行うア
ルゴリズム)や,オフライン手書き文字認識用アルゴリ
ズム(記入後に一括して認識を行うアルゴリズム)に2
分される各種のアルゴリズムが提案されているが,本発
明では,オフライン型の各種アルゴリズムを用いること
ができる.帳票入力部からは最終的に,各文字に対応す
るイメージデータから変換された文字コードが,信号線
21を介して出力される。
第2図は,第1図中のノイズ除去部8の動作を説明する
ための図で,22は黒画素の連なりを検出する処理ブロ
ック,23は黒画素の連なりに含まれる黒画素数(B)
を計数する処理ブロック24は23によって計数された
黒画素数が,予め定める個敢(S)との多少を判定する
処理ブロンク,25は上記の判定処理ブロックによって
,ノイズまたは本発明に基づく記入欄の囲みと判定され
た黒画素の連なりを入力イメージデータから除去する処
理ブロノクである。
まず,黒画素の連なりの検出においては,入力イメージ
データ中において隣接する黒画素を全て調べそれらを黒
画素の連なりとする.次に上記の黒画素の連なり中の黒
画素数(B)を調べ.判定処理部24において.ノイズ
として識別される黒画素数の最大値(S)との比較を行
う。ここでSの値には,前記のとおり.イメージスキャ
ナの仕様によって,画素読取りの密度が異なるため,イ
メージスキャナに応した値を予め設定しておく。
例えば.300DPl  (1インチ当り300画素=
1mm当りl2画素)のイメージスキャナの場合.Sの
値は50程度である。判定処理部24によってノイズ(
本発明に基づく記入欄の囲みもノイズとみなされる)と
判定された黒画素の連なりについては.次の処理ブロソ
ク25において,イメージデータから除去し.それ以外
の黒画素の連なりについては,記入文字を構或する黒画
素の連なりとして残す。
以上説明したノイズ除去動作によって パーソナルコン
ピュータ等に接続した通常のプリンタによって帳票を印
刷し,手書き文字を記入した該帳票から,後の文字認識
の対象とする各文字のイメージデータのみを抽出するこ
とが可能となる.即ちドロップアウトカラー印刷などを
行う必要がなくなる。
第3図はプリンタによって印刷する帳票の一例を示す図
であり,27は姓の記入欄の囲みを28は名の記入欄の
囲みを.29は住所の記入欄の囲みをそれぞれ示してい
る。本発明に基づく記入欄の囲みは5第3図に示した破
線の他に、ノイズとして除去可能な個数の黒画素の集合
であればいずれの形状であっても良い。例えば他に,十
*.・,等の形状が考えられ.印刷色や記入欄内容等に
よって.適宜妥当な形状を選択できる。
〔発明の効果] 以上説明したように,本発明によれば,ノイズとは識別
され得る黒画素数を有するバタンの連なりをもって記入
欄の囲みとして用いた帳票を作或し,文字認識前に,記
入欄囲み部分の黒画素をノイズとして除去することを可
能とすることで,ドロンブアウトカラーを用いなければ
帳票作威が行えないとし・う問題を解決し,パーソナル
コンピュータ等に接続されたプリンタや複写機によって
容易に帳票の作威を行うことができる。
【図面の簡単な説明】
第1図は本発明の一実施例構或,第2図は本発明に基づ
き印刷した帳票を読取る処理フロー.第3図は本発明に
基づいて印刷した帳票の例を示す。 図において,1はパーソナルコンピュータ 2は操作卓
.3はプリンタ,4は帳票,5はイメージスキャナ,6
は記入欄文字切出し部,7は帳票形式情報,8はノイズ
除去部,9は文字認識部10は文字辞書,27は姓の記
入欄の囲み.28は名の記入欄の囲み5 29は住所の
記入欄の囲みである。

Claims (1)

  1. 【特許請求の範囲】 各記入欄の位置を記入者に識別させるための記入欄囲み
    を印刷した帳票を用い、該記入欄囲み内に記入された文
    字列を認識する処理において、連続する黒画素の個数に
    よって、文字の一部であるかノイズであるかを自動識別
    する機能を備え、ノイズとは識別され得る黒画素数を有
    する独立した複数のパタンによって記入欄の囲みを構成
    するようにした帳票が用いられ、 文字認識対象とするイメージデータの切出しにおいては
    、該ノイズ除去機能を用いて該記入欄囲みを除去するよ
    う構成してなり、各文字に相当するイメージデータ部分
    の取得を行うようにしたことを特徴とする帳票入力処理
    方式。
JP1308081A 1989-11-28 1989-11-28 帳票入力処理方式 Pending JPH03167685A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1308081A JPH03167685A (ja) 1989-11-28 1989-11-28 帳票入力処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1308081A JPH03167685A (ja) 1989-11-28 1989-11-28 帳票入力処理方式

Publications (1)

Publication Number Publication Date
JPH03167685A true JPH03167685A (ja) 1991-07-19

Family

ID=17976646

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1308081A Pending JPH03167685A (ja) 1989-11-28 1989-11-28 帳票入力処理方式

Country Status (1)

Country Link
JP (1) JPH03167685A (ja)

Similar Documents

Publication Publication Date Title
JP4854491B2 (ja) 画像処理装置及びその制御方法
JP2006092346A (ja) 文字認識装置、文字認識方法および文字認識プログラム
US20020028020A1 (en) Image processing device, image processing method, and image processing program
JP3178483B2 (ja) 文書処理装置
JP3636490B2 (ja) 画像処理装置および画像処理方法
JP2008028716A (ja) 画像処理方法及び装置
US5854860A (en) Image filing apparatus having a character recognition function
JP3142986B2 (ja) 文書情報検索装置
JPH03167685A (ja) 帳票入力処理方式
JP4159948B2 (ja) 2次元コード読み取り装置、2次元コード読み取り方法及び2次元コード読み取りプログラム、記憶媒体
JPH07262317A (ja) 文書処理装置
US20240062567A1 (en) Learning Image Generation Apparatus, Learning Image Generation Method, And Non-Transitory Computer-Readable Recording Medium
JP2000331117A (ja) 文書読取システム
CN106959940A (zh) 一种便于文档自动化录入的文档格式及转换和识别方法
JPH04309B2 (ja)
JPH10198705A (ja) 文書画像処理装置および文書画像処理方法および情報記録媒体
JP2665226B2 (ja) 文字認識装置
JP2931485B2 (ja) 文字切出し装置及び方法
JP2570571B2 (ja) 光学文字読取装置
JP2813600B2 (ja) 表形式文書読取装置
JP2784004B2 (ja) 文字認識装置
JPH08171608A (ja) 帳票様式識別方法および装置
JP3060237B2 (ja) 日本語文字認識装置
JPH0789361B2 (ja) 帳票登録装置
JPH06243285A (ja) 文字認識方法