JPS58105384A - 特殊文字認識機能を有する画像処理装置 - Google Patents

特殊文字認識機能を有する画像処理装置

Info

Publication number
JPS58105384A
JPS58105384A JP56204110A JP20411081A JPS58105384A JP S58105384 A JPS58105384 A JP S58105384A JP 56204110 A JP56204110 A JP 56204110A JP 20411081 A JP20411081 A JP 20411081A JP S58105384 A JPS58105384 A JP S58105384A
Authority
JP
Japan
Prior art keywords
character
characters
special
information
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP56204110A
Other languages
English (en)
Inventor
Yasufumi Mitsuzawa
光澤 康文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp, Nippon Electric Co Ltd filed Critical NEC Corp
Priority to JP56204110A priority Critical patent/JPS58105384A/ja
Publication of JPS58105384A publication Critical patent/JPS58105384A/ja
Pending legal-status Critical Current

Links

Classifications

    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F9/00Games not otherwise provided for
    • A63F9/20Dominoes or like games; Mah-Jongg games

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は、画像と文字とが混在する帳票を光学的に走査
し【処理を行う画像処理装置に関する。
従来、電子計算機への入力データとして、グラ又は、光
学文字読取装置による文字データ等〆iりた。しかしな
がら、画像イメージ情報を入力し電子計算機でとの画像
情報をそのまま、他へ転送するような画像イメージのス
イッチング機能、及び画像イメージと電子計算機の内部
に持っている文字=−ドデータとを編集してイメージプ
リンタ(画像及び文字を印字するプリンタ)に出力する
イメージ処理システムの開発が活発になってきた。
イメージ処理システムに使用される種々の帳票につい【
考えてみよう。
まず、日常生活で使用される伝票は、数値情報とそれを
見やすくするために縦、横、斜めの罫線を書き表の形式
Kl、?ある。数値情報はキーボード等により入力可能
であるが、罫線の情報は通常はフオーム(形式)情報と
して伝票毎に別途新規にフオーム情報のプルグラムを作
成する必要があり、作業者にかなりの負担をかけている
次に、ワードプロセサに入力する手書書類の清書につい
て考えてみよう。手書文字は、種々のキーボードにて入
力可能であるが、特に漢字等の入力は高度の熟練を要す
るものであり、素人にはかなりの困難な作業である。し
かし、近年の文字(漢字)wt識投技術急速な発達によ
り、文字読取装置による入力をも実現可能となってきて
おり、文字の入力手段としては文字入力の大幅な自動化
が可能となってきている。
次に、印鑑登録の印鑑イメージについて考えてみよう。
印鑑イメージは、キーボードやフオーム情報でもって入
力することができず、印鑑の欠は線幅、印影の払いや押
さえ等の微妙な画像情報を入力する必要があり、これは
通常ファクシミリ装置等により実現することができる。
しかし、印鑑登録の際の住所・氏名等は、相変らずキー
ボードにより入力する必要があり画像情報と文字情報の
自動入力は非常に困難である。
次に、日本地図等のように複雑な曲線図形について考え
てみよう。
複雑な曲線図形は、直線部分がほとんどなく、これらの
曲線図形の画素をディジタイザ装置によって、その座標
を入力するのは比較的容易であるが、ディジタイザ装置
では文字データを入力することができない。また、ディ
ジタイザは高価な装置であり、装置の設置数も少なく必
要によりすぐ使用できる装置ではない。そこで、画素の
座標をプログラムによりコーディングして入力すること
になるが、これには膨大な時間がかかる。ちなみKAA
版の日本地図の座標をコーディングして、それをキーボ
ードにより入力した場合に約2日間を要したという実績
もある。
以上のような、罫線情報と文字とにより構成される通常
の伝票、ワードプロセサに入力されるための手書書類、
印鑑等の忠実な画像を再現する必要のある画像、・日本
地図等の複雑な曲線図形等の2つ以上のものが混在して
いる帳票について汎用的に使える装置は、ファクシミリ
装置のみである。
しかしながら、ファクシミリ装置は、手書文字9清書機
能がないこと、および画像イメージとして通信回線を経
由して電子計算機に入力されるために伝送時間が長く、
回線使用料金が高くなる。また更に、電子計算機のファ
イル容量が多くなるという欠点がある。
したがって本発明の目的は、画像と文字とが混在する帳
票を光学的に走査し、画像情報と文字情報とな区別して
処理できる画像処理装置を提供することである。
本発明によれば、特殊文字のla!鍼により例えば文字
g職機能図形読散機能及びディジタイズ機能等を実施す
ることにより、上記のような各種の図形、文字の処理を
一つの装置を用いて14現できる画像処理装置を得るこ
とができる。
以下、本発明の一実施例を・示した図面を参照して、本
発明をより詳細に説明する。
第1図を参照すると、この図に示した書類は、官庁や民
間金社等で使用される書類の一例で、本発明の一実施例
により処理される。本図において1−1〜1〜5は表題
部分を示し、例えば1−1は書類の配布売名、1−2は
罫線部分、表題および書類作成日時、氏名等である。1
−3および1−4は、2個の特殊文字(Fl(Form
 7オーA  情報な示す)(口の中に、Fという文字
が記入された図形文字)であり、これらにより囲まれる
矩形領域1−5内に罫線および文字が含まれていること
を示す。1−11.1−21.1−31は、本文の内容
であり、文字のみで構成されている。1−22はセンタ
ー側の電子計算機に図形データを入力し、グツクイック
ディスプレイKN示するように要求されている。色分は
指示を指定された日本全国地区別分布図等の例に見るこ
とができる固形入力領域である。1−23および1−2
4は、2個の特殊文学1](Digitize ディジ
タル化する)(口の中にDという文字が記入され【いる
図形文字)であり、これらにより囲まれる矩形領域1−
25内にセンターの電子計算機に入力する図形および特
殊文字により色癲定されている図形があることを示す。
1−41は、印鑑や1嫁氏名等を示す領域で文字認識や
図形認識が実施できずなおかつ、′ありのままの画像イ
メージな必要とするものである。
1−42および1−43は、2個の特殊文字国(Pic
ture画像)(口の中にPという文字が記入されてい
る図形文字)であり、と、れらにより囲まれる矩形領域
1−44内に画像を画像イメージとして抽出することを
示す。
第2図を参照すると、本発明の一実施例において、第1
図に示すような帳票2−1は、従来のファクシミリ装置
または光学文字読敗装置の光学的な走査と同様に走査制
御部2−3により、光学的走査部2−2により走査され
、光電変換52−4により帳票の濃淡に応じた電気信号
に変換される。
変換された電気信号は、画像イメージメモリ2−6に格
納され、また、細線化回路2−5′VC供給される。細
線化回路2−5は、鉛筆やボールペン等の筆記具により
書かれた線幅を有する図形および文字等の画像を線幅1
ビツトのみの芯線にするように、線の太さを端から剥ぐ
ように設計された回路であり、細線化の方式としては、
文献”8omeParallel Thinning 
Algarithm for DigitalPict
ures” by R,5TEFANELL  and
人、几0SBNFEI、D  1971  Apr、J
ACM 等に詳細に示されている。
%株文字11ffil−3(1−4)の画像イメージ3
−4および細線化パターン3−2を第3図に、更に日本
地図の東京地区1−25の両像イメージ4−1および細
線化パターン4−2を第4図にそれぞれ示す。
細線化パターンは、細線化メモリ2−7に格納され、文
字読取部2−8に供給される。細線化パターンから、文
学を認識する技術は既に昭和51年から出荷されている
製品(例えば日本電気、N6370、N6370I4)
において確立された技術であり、例えば日本電気枝軸1
977年Na119にも詳細に示されている。
特殊文字n田肥等にて、囲まれた領域以外の文字領域、
即ち1−1.1.−11.1r−21,1−31等は、
全て文学読取部2−8において文字認識され文字コード
を作成し、文字コードメモリ2−9に格納される。特徐
文字[Ell−3を認識した場合、罫線を示す情報は図
1−3の右下部分に存在することを示す。更に、特殊文
字囲1−4を認識した場合にはl]1−4の左上の部分
にフオーム情報が存在する。即ち[11−3と[51−
4により矩形領域1−5内にのみフオーム情報が存在す
ることを示す。
このように特殊文字が認識されれば、その座椰位蓋アド
レスを特殊文字アドレスメ篭り2−12に格納し、矩形
領域1−5を切り出す為の図形切出制御部2−”’1−
3に信号を与える。図形切出制御部2−13は、細線化
パターンメモリ2−7から特殊文字の座標位置アドレス
で指定される矩形領域1−5を抽出するように制御し、
図形切出領域を満足する領域のみゲートを開く図形切出
ゲート回路2−10を経由し【、矩形領域1−5のみが
図形イメージメモリ2−11に格納される。即ち、罫線
により囲まれた矩形領域5−1(第5図)のみが格納さ
れる。
図形切出制御部2−13では、特殊文字囲(フオーム情
報)であることを識別しており、フオーム情報検出部2
−19に制御を渡す。フオーム情報検出部2−19はま
ず、水平方向の走査5−2(第5図)K示すよ5に、罫
線の矩形領域5−1の左上部から右水平方向に走査して
、図形の高さを確認し図形の高さが平均の文字の高さの
2倍以上あれば、図形と判断し、図形の上部の最上部位
置A3−3から図形を追跡走査する方式により細線化パ
ターン上を追跡する。
線追跡走査方式は、輪郭線を抽出するものであり、走査
なら@Xに行ない得られた黒点の画素列を検出するもの
である。通常は、フライングスポットスキャナ等のハー
ドワエアを使用するが、本実施例では、細線化され格納
された図形イメージメモ!72−11に対してプログラ
ム的に追跡する。
即ち、第6図において、点6−1より細線化パターンを
左廻りに回転しながら端点(線の両端)分岐点(線が1
字形又はX字形に分岐する点)および屈折点(ある角度
以上で線分が曲うている点)を検出していく。
第7図において、*点7−1に注目した場合、廻り8ビ
ツトのマスクパターンA〜Hの各点に注目して、第8図
の8−1〜8−8の各マスクパターンの条件を満足する
場合は端点、第9図の9−1〜9−12の各マスクパタ
ーンの条件を満足する場合は分岐点と定義する。なお、
第8図および第9図において。「0」および「1」は白
および黒の点rXJは白又は黒いずれでも良い点「視。
Xs −Xs J ハVt VXm VXm = 1 
’に満足スル?ニー ト’に表わす。
第6図につい【、点6−2.6−3.6−7は分岐点を
6−4は端点な示す。
屈折点は、第10図において細線化パターンを5ポイン
トごとにナングルしてサンプル点五に対し℃、直iii
、  j+1およびi+2.i+3のなす角θを求め#
)141°の場合は屈折点でないとし、0≦141°の
場合は、θ1,0.を求める。0.とθ2を比軟して小
さな方の角、例えば#s<hならば、θ1をさらに小さ
くする方向に移動させ、01が極小になる点を10.そ
の極小値を00とすればminiuum (θm#・)
≦1310ならばio”t’屈折点とする。第6図につ
いて6−1.6−5.6−6に屈折点な示す。
とのよ5にして検出された!′特徴点データ(端点分岐
点、屈折点)は、フオーム情報として第11図に示され
るようなテーブルに整理し、座標、接続関係をフオーム
情報としてフオーム情報バッファ2−20に格納する。
このよ5 K 7 *−ム情報が作成されると、図形消
去制御部2−23によりその罫線部分をII!続開係に
従って、再度線追跡走査しながら消去する。即ち、図形
イメージメモリ2−11により、図形消去制御部2−2
3からの制御信号により文字抽出ゲート回路2−21を
経由しズ、罫線内の文字情報のみを図形白文字パターン
メ七り2−22に格納し、さらに文字読取部2−8に供
給され、通常の文字読取りを実行する。
la!織された文字は、文字コードとして文字コードメ
モリ2−9に格納される。
以上のようにし【、l−2に示すフオーム情報の作成お
よび罫線内の文字を抽出し、認識することができる。
次に、特殊文字1ll−23と13;)1−24を認識
した場合につい【説明する。図形の矩形領域1−25が
検出され、前記と同様に図形イメージメモリ2−11に
格納され、また図形切出制御部2−13にも特殊文字−
が認識された事が指示され、これによりディジタイズ走
査制御部2−17が図形(この場合は日本地図)を同様
に線追跡走査する。このようにして線追跡走査を実施し
、走査したときに検出される黒点の個々の座標の値をデ
ィジタイズ・アドレス・バッファ2−18に格納する。
線追跡走査をする場合、走査される図形の画素から構成
される周長は、長いという、こ、とを利用し【周長が成
る一定値近傍であるかどうかを検出する。即ち、図形の
中に含まれる特殊文字はO(丸)で囲まれるとすると、
特殊文字の外周長は成る一定値近傍であることおよび線
追跡走査で出発点と最終の戻りの点が一致する。このよ
うな図形部分は特殊文字と考える。局長が長い場合およ
びかなり短い場合は図形部分と考えて、図形消去制御部
2−23で図形部分を消去し、図形白文字パターンメモ
リ2−22に格納される。図形白文字パターンメモリ2
−22には、特殊文字O(丸)等の細線化パターンのみ
が格納され【おり、文字読取一部2−8に供給され、文
字読取される。
このように、図形の中に特殊文字を記入し、その文字コ
ードをセンターの電子計算機に入力させることにより、
領域の色指定をセンター側の電子計算機のプログラムで
判定できる。例えば、°緑色に対し【は、特殊文字とし
て◎、赤色に対し【は特殊文字としC■等の文字を指定
する。
次に、特殊文字[!!+1−42.]−43を認識した
場合には画像の矩形領域1−44が検出され、画像イメ
ージメモリ2−6及び図形切出制御部2−13により、
画像イメージ走査制御部2−14により、画像(この場
合は、自筆氏名及び印鑑)を走査する。この場合の走査
は、ファクシミリと同様に水平方向に主走査、垂直方向
に副走査を実施する。この走査する時にファクシミリ装
置と同様にM H(Mod i f i ed −Hu
 f fmmnn ) 又ハ、MR(Mod 1 f 
i ad−Reed )等の画像の帯域圧縮2−15を
実施し、帯域圧縮された情報は7アクシ)リイメージバ
ッファ2−16に格納される。ファクシミリの走査の場
合には画像の内部に文字が存在しても認識することがで
きない。
以上、7オーム情報バy7ア2−20.ゲイジタイズ・
アドレス・バ、772−18及びファクシミリイメージ
バッファ2−16に格納された情報に対して、識別コー
ド発生部2−24により、個々にラベルが付加され、送
信制御部2−25及び変調器2−26及び通信回線を経
由してセンターの電子計算機に入力される。この場合、
付加される識別ラベルは文字、フオーム情報、ディジタ
イズ情報、ファクシミリ情報の識別、各情報の開始位置
及びデータ長等が付加される。
以上説明したように、画像部分と文字部分が混在する帳
票を光学的に走査し得られた電気信号につい【、帳票に
追記された特殊文字11t=qtb等を認識するととK
より単純図形の特殊情報を抽出し、フオーム情報を作成
し画像をファクシミリ装置のように走査し、また複雑な
図形については画素の位置アドレス情報を作成する機能
を有するような光学文字読取装置及びファクタt Q装
置の諸機能を有する。
本発明によれば、次のような効果が得られる。
■ 事前に作成された任意の帳票に対して、4I殊文字
11!!J[!!lII]等を任意にあとから追加する
ことにより情票内容を指定する情報の形式で自動的にセ
ンター側の電子計算機に入力することができる。また、
特殊文j囚を、その囲まれた領域の情報は内力しないよ
うな特殊文字と定義することにより、その範囲の情報は
入力しなくすることも容易に可能であることは推測でき
る。
■ 通常、固形や鼾線等が記入されている帳票の文字認
識は不可能であり、そのためのデータ入力手段としてフ
ァクシミリ装置が利用される。しかし、画像イメージと
し曵入力する場合はたとえ帯域圧縮され【もデータ蓋が
膨大となり、通信回線の専有時間も長くなり、またセン
ターの電子計算機のファイル容量も膨大となる。
本発明は、文字認識、7オーム情報の作成、ディジタイ
ズ情報の作成及び不要部分の消去等により、データ量を
ファクシミリ装置に比較し?/10〜/100位に縮少
できる。
■ 色識利用の特殊文字の、0等(■は赤色、◎は緑色
等を示す)をwl繊することにより、罫線内及びディジ
タイズ図形内の成る領域の色を規定することができる。
本発明は、前述の実施例に限定されるものではなくその
要旨な変更しない範囲で種々の変形が可能である。たと
えば図形の特徴情報の抽出及び文字認識について細線化
回路を使用せずに、画像イメージから直接に位相情報等
を検出することにより4tl[情報の抽出や文字iti
!!敵を1iA施してもよい。
また、特殊文字について任意に付加することができる。
例えば、@ (Regis trate  登録する)
により指定された領域は、その帳票の登録番号を示す。
更にl](Voice音声として使用する)により指定
された領域の文字列はセンターに入力されたあとはその
文字列の転送は音声とし℃実施することを意味するよう
に指定できる。これらは、いずれもセンター側の電子計
算機のプログラムに対して識別ラベルに【指示すれは、
センター側に【識別し実行可能である。7オーム情報の
作成として、円グラフ、禅グラフ、折線グラフ等の直線
及び円により構成される本純な図形に対しても容易に適
用可能である。
【図面の簡単な説明】
第1図は本発明で使用される帳票の一例な示し第2図は
本発明装置の一実施例を示すブロック構成図、第3図囚
および0は特殊指定文字の画像イメージおよび細線化パ
ターンを示す図、第41囚およびβは図形の画像イメー
ジおよび細線化ノくターンを示す図、第5図は帳票内の
罫線部分の図形を示す図、第6図は罫線部分のフオーム
情報特徴点を示す図、第7図は指定された点の廻りの8
点を示す図、第8図は端点検出用マスクを示す図、第9
図は分岐点検出用マスクを示す図、第10図は屈折点検
出のアルゴリズムを示す図、第11図はフオーム情報の
テーブルを示す図である。 第 3 薗(A) 3−2 年 3 m (B) #−4図 (A) #−4回(E3) J#6  記 L 隼10 薗 阜// 図

Claims (1)

    【特許請求の範囲】
  1. 画像と文字とが混在する帳票を光学的に走査して得られ
    た画像信号から文字を認識する手段と、指定された特殊
    文字を認識しその特殊文字にて囲まれる矩形の画像領域
    に対して、個々の特殊文字が規定する制御を実施する手
    段とを具備することを特徴とする特殊文字認識機能を有
    する画像処理装置。
JP56204110A 1981-12-17 1981-12-17 特殊文字認識機能を有する画像処理装置 Pending JPS58105384A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56204110A JPS58105384A (ja) 1981-12-17 1981-12-17 特殊文字認識機能を有する画像処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56204110A JPS58105384A (ja) 1981-12-17 1981-12-17 特殊文字認識機能を有する画像処理装置

Publications (1)

Publication Number Publication Date
JPS58105384A true JPS58105384A (ja) 1983-06-23

Family

ID=16484960

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56204110A Pending JPS58105384A (ja) 1981-12-17 1981-12-17 特殊文字認識機能を有する画像処理装置

Country Status (1)

Country Link
JP (1) JPS58105384A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62184580A (ja) * 1986-02-07 1987-08-12 Matsushita Electric Ind Co Ltd 文書清書装置
JPS63115267A (ja) * 1986-10-31 1988-05-19 Nippon I C S Kk 伝票等の記載事項復元処理装置
WO2006077687A1 (ja) * 2005-01-24 2006-07-27 Global Value Corporation 文字列シンボル生成装置及び文字列シンボル生成方法並びに文字列シンボル生成プログラムを格納した記憶媒体

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62184580A (ja) * 1986-02-07 1987-08-12 Matsushita Electric Ind Co Ltd 文書清書装置
JPS63115267A (ja) * 1986-10-31 1988-05-19 Nippon I C S Kk 伝票等の記載事項復元処理装置
WO2006077687A1 (ja) * 2005-01-24 2006-07-27 Global Value Corporation 文字列シンボル生成装置及び文字列シンボル生成方法並びに文字列シンボル生成プログラムを格納した記憶媒体
JP2006202231A (ja) * 2005-01-24 2006-08-03 Global Value Kk 文字列シンボル生成装置及び文字列シンボル生成方法並びに文字列シンボル生成プログラムを格納した記憶媒体。

Similar Documents

Publication Publication Date Title
US20020051574A1 (en) Character recognition method, program and recording medium
JP4198392B2 (ja) 2次元コード読取装置、画像入力装置、2次元コード読み取り方法、画像入力方法、そのプログラム、及びそのプログラムを記録した記録媒体
JP7035656B2 (ja) 情報処理装置及びプログラム
JPS58105384A (ja) 特殊文字認識機能を有する画像処理装置
US5228097A (en) Method for registering image data
JPS58208865A (ja) 文書作成装置
JP3255503B2 (ja) 帳票イメージ処理装置
JP2000181988A (ja) 光学文字読取装置
JP2003046746A (ja) 画像処理方法及び画像処理装置
JPH05292294A (ja) デジタル複写機
JPH0355867B2 (ja)
JPS61198376A (ja) 光学的文字読取装置
JP2931041B2 (ja) 表内文字認識方法
JP3196603B2 (ja) バーコード認識方法及びシステム
TW432336B (en) A recognition processing method for forms
JPS6292080A (ja) 文字パターン認識修正装置
JP2022071956A (ja) 地理情報取込システム、地理情報取込方法及びプログラム
JPH05242297A (ja) 文字切り出し方法
JP2996768B2 (ja) レポート作成装置
EP0381794A1 (en) Method for registering image data
JPH0459668B2 (ja)
JPH031278A (ja) 図面読取り方法及び装置
JPH0459669B2 (ja)
JPH0271379A (ja) 画像処理装置
JPS61198377A (ja) 光学的文字読取装置