JP2929919B2 - 光学文字切出し装置 - Google Patents

光学文字切出し装置

Info

Publication number
JP2929919B2
JP2929919B2 JP5304198A JP30419893A JP2929919B2 JP 2929919 B2 JP2929919 B2 JP 2929919B2 JP 5304198 A JP5304198 A JP 5304198A JP 30419893 A JP30419893 A JP 30419893A JP 2929919 B2 JP2929919 B2 JP 2929919B2
Authority
JP
Japan
Prior art keywords
character
pattern
unit
contour
extracting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP5304198A
Other languages
English (en)
Other versions
JPH07160813A (ja
Inventor
和仁 中西
大輔 西脇
敏晴 浅野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP5304198A priority Critical patent/JP2929919B2/ja
Publication of JPH07160813A publication Critical patent/JPH07160813A/ja
Application granted granted Critical
Publication of JP2929919B2 publication Critical patent/JP2929919B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字を光学的に読み取
る装置に関し、特に帳票上に記載された文字を一文字分
ごとに切り出す光学文字切出し装置に関する。
【0002】
【従来の技術】従来この種の文字切出し装置は、帳票上
に記載された文字を、予め指定された1文字切出し位置
情報及び周囲の文字パターンより投影処理を行い1文字
切出しを行っていた(例えば、特開昭63−57831
号公報)。
【0003】この種の投影処理による切出し方法につい
て図2,図6及び図7を用いて詳細に説明する。
【0004】図7は投影処理を用いた1文字切出し方法
のブロック図である。光学変換部1は、光学変換素子及
びA−D変換回路からなり、帳票上に記載された文字パ
ターンイメージを読取り、2値化電気信号に変換する。
光電変換部1により2値化された文字パターンは2値化
パターンメモリ部2に記憶される。投影処理部3は記憶
された2値化文字パターンのx軸データをy方向に投影
処理して圧縮データを求める。文字切出し部4はこの圧
縮データより1文字ブロックと判定し、予め指定された
1文字切出し位置情報8に基づいて1文字の切出しを行
っていた。
【0005】図2は重なり文字の入力パターンを示す図
及び、その圧縮データ(a)を示している。圧縮データ
(a)より1文字ブロックと判定し、予め指定された1
文字切出し位置情報S0より切出し面S1にて切断し、
図6に示すような1文字の切出し結果が得られる。
【0006】しかしながら、投影処理のみにより1文字
切出しを行う光学文字切出し装置は、文字パターンのデ
ータを圧縮パターンを用いて1文字切出しを行うため、
1文字切出し位置情報よりはみでている文字や、重なっ
ている文字は、強制的に文字が切断されるため有効なデ
ータが失われてしまったり、隣接位置にある文字の一部
が残ってしまうという問題点があった。
【0007】この問題点を解決するために、2値化パタ
ーンを投影処理せず、各文字パターンについて輪郭トレ
ースを行うことによって1文字の切出しを行う手段が
(例えば特開平1−156888)公報に提供されてい
る。
【0008】この種の、全文字パターンについて輪郭ト
レースを行うことによって1文字の切出しを行う光学文
字切出し装置について図8を用いて説明する。
【0009】帳票上に記載された文字イメージは光学変
換素子及びA−D変換回路からなる光電変換部1によ
り、2値化電気信号に変換され、この2値化された文字
パターンは2値化パターンメモリ部2に記憶される。輪
郭トレース部5は文字パターンの画素情報について1画
素毎の画像データの輪郭となる画素を抽出してトレース
を行い、この画素情報の座標値は輪郭トレース座標メモ
リ部6に記憶される。文字切出し部7はこの輪郭トレー
ス座標メモリ部6から出力される輪郭画素情報の座標値
と、予め指定された1文字切出し位置情報8に基づいて
文字切出しを行う。
【0010】
【発明が解決しようとする課題】従来の投影処理のみに
より1文字切出しを行う光学文字切出し装置は、文字パ
ターンのデータを圧縮パターンを用いて1文字切出しを
行うため、1文字切出し位置情報よりはみでている文字
や、重なっている文字は、強制的に文字が切断され有効
なデータが失われてしまったり、隣接位置にある文字の
一部が残ってしまうという問題点があった。
【0011】また、投影処理を行わず、各文字パターン
について輪郭トレースを行うことによって文字を切出す
光学文字切出し装置は、全ての文字に対して輪郭トレー
スを行うため処理速度がかなり遅くなってしまい、さら
に、輪郭画素情報の座標値をメモリ部に記憶させるた
め、文字ブロックが多くなるほどメモリが大量に必要に
なってしまうという問題点があった。
【0012】
【課題を解決するための手段】上記問題点を解決するた
めに、本発明による光学文字切出し装置は、紙葉類上の
文字を光学的に走査して得られる文字パターンに対し投
影処理を行い投影データを得る手段と、得られた投影デ
ータおよび予め設定された1文字切出位置情報に応じ
て、前記文字パターンを1文字ごとに切り出す切出手段
と、前記切出手段による文字切出処理の結果において、
前記文字パターンに対する切出面に接触する隣接した文
字パターンに対してのみ輪郭処理を行い、該隣接した文
字パターンを分離する分離手段とを備える。
【0013】
【実施例】次に、本発明について図面を参照して説明す
る。
【0014】図1は本発明の一実施例を示すブロック図
である。帳票上に記載された文字イメージは光学変換素
子及びA−D変換回路からなる光電変換部1により、2
値化電気信号に変換され、この2値化された文字パター
ンは2値化パターンメモリ部2に記憶される。投影処理
部3において2値化文字パターンのx軸データはy方向
に投影処理され、圧縮データ9が求められる。第1の文
字切出し部4はこの圧縮データ9より1文字ブロックと
判定し、帳票上に印刷された枠などの予め指定された1
文字切堕し位置情報8に基づいて1文字の切出しを行
う。文字パターンが切断面に接している場合には輪郭ト
レース部5においてその文字パターンの輪郭をトレース
し、輪郭トレース部5で求められた輪郭画素情報の座標
値を輪郭トレース座標メモリ部6に記憶する。第2の文
字切出し部7は輪郭トレース座標メモリ部6に記憶され
た輪郭画素情報の座標値、1文字切出し位置情報8及
び、圧縮データ9に従って文字を切り出す。
【0015】図2は重なり文字の入力パターンA,Bを
示す図及び、投影処理部3において求められた圧縮デー
タ(a)を示している。この圧縮データ(a)及び予め
指定された1文字切出し位置情報に基づいて第1の文字
切出し部4にて1文字の切出しを行うのであるが、この
際、図2の文字パターンA,Bのように切出し面S1に
文字パターンが接している場合はそれぞれの文字パター
ンに対して輪郭トレース部5にて輪郭トレースを行う。
【0016】次に図2,図3及び図4を用いて輪郭トレ
ース手段の一実施例を説明する。図2においてP0
(0,0)はトレース中心パターン座標であり、ここか
らx軸方向に1ラインずつ黒パターンが開始する点(a
s)及び黒パターンが終了する点(ae)のx座標を輪
郭トレース座標メモリ部6に記憶する。この作業をy方
向に1ラインずつずらしながらトレースエリア全てに対
して行い、図3に示すようにbs,be,cs,ce,
…と求めて輪郭トレース座標メモリ部6に記憶してい
く。そして、連続する2つのラインの黒パターンについ
て、前ラインの黒パターン開始点のx座標をKs、黒パ
ターン終了点のx座標をKe、後ラインについても同様
にLa,Leとしたとき、図4の接触パターンより接触
条件Ks≦Le+1かつKe+1≧Lsを満たしている
場合は、その連続する2つのラインの黒パターンは同じ
文字ブロックの構成要素であると判定し、この接触条件
を満たしていない場合は、その連続する2つのラインの
黒パターンは異なる文字ブロックの構成要素であると判
定する。このようにして全トレースエリア内の黒パター
ンをそれぞれブロックに分ける。次に、図3に示すよう
な各ブロックのx方向の最小x座標Axmin、Bxm
in、及び最大x座標Axmax、Bxmaxをそれぞ
れ求める。同様にy方向についても最小y座標Aymi
n、Bymin及び最大y座標Aymax、Bymax
をそれぞれ求める。
【0017】各ブロックのx,y方向の最小及び、最大
座標位置が求まり、これにより第2の文字切出し部7に
おいて図5に示すような2つの文字ブロックに切り離
す。
【0018】ここで輪郭トレース手段の一実施例を示し
たが本願発明の効果を得るためにはこのトレース手段に
限られるわけではなく、例えば、特開平1−15688
8号に開示されているような2値化された文字パターン
に対して1画素毎に黒パターンを検出し、その文字パタ
ーンの輪郭をトレースしていく手段でもかまわない。
【0019】また、上記実施例においては文字切出し部
を第1の文字切出し部と第2の文字切出し部の2つに分
けたが、必ずしも分ける必要はなく、1つの文字切出し
部において2回の切出しを行ってもよい。
【0020】また、文字パターンを切り出す際に予め定
められた1文字切出し位置情報がない場合、つまり、自
由手書き文字を切り出す場合においても、本発明の光学
文字切出し装置は、帳票上に記載された自由手書き文字
のイメージは光学変換素子及びA−D変換回路からなる
光電変換部1により、2値化電気信号に変換され、この
2値化された文字パターンは2値化パターンメモリ部2
に記憶される。投影処理部3において2値化文字パター
ンのx軸データはy方向に投影処理され、圧縮データが
求められ、圧縮データが途切れている部分で第一の切出
しを行い、得られた圧縮データが1行サイズを考えて長
すぎる場合は、この部分が複数の文字パターンが重なっ
ている部分か、または、その影が重なっている部分と判
断し、その部分の文字パターンに関してのみ輪郭トレー
ス部5において輪郭トレースを行い、輪郭トレース部5
で求められた輪郭画素情報の座標値を輪郭トレース座標
メモリ部6に記憶し、輪郭トレース座標メモリ部6に記
憶された輪郭画素情報の座標値及び、圧縮データに従っ
て第2の文字切出し部7において文字を切り出すという
処理を行うことにより十分な効果が得られる。
【0021】
【発明の効果】以上説明したように本発明による光学文
字切出し装置は、文字パターンを一度投影処理を行い、
予め指定された切断面に接しているパターンに関しての
み輪郭トレースを行い、文字を切り出すという処理を行
うことにより、予め指定された切出し枠からはみ出して
いる文字や、重なっている文字に対して有効なデータが
失われたり、隣接文字の一部が残り誤認識されたりする
ことがなく正確に文字を切り出すことができ文字認識の
精度が向上する効果があると共に、投影処理を行うこと
により切断面に接触しない文字パターンに関しては輪郭
トレースを行わないため、切出し処理速度が向上し、ま
た、輪郭画素情報の座標値を記憶させるために必要なメ
モリに関しても輪郭トレースのみの処理を行う場合に比
べて小量ですむという利点がある。
【図面の簡単な説明】
【図1】本発明の一実施例を示すブロック図。
【図2】投影処理及び輪郭トレース処理を行う文字パタ
ーン情報図。
【図3】輪郭トレースを行う文字パターンを示す図。
【図4】各黒パターン座標の前ラインとの接触条件を示
す図。
【図5】輪郭トレース処理により切り出された文字パタ
ーンを示す図。
【図6】投影処理により切り出された文字パターンを示
す図。
【図7】従来の投影処理のみによる光学文字切出し装置
を示すブロック図。
【図8】従来の輪郭トレース処理のみによる光学文字切
出し装置を示すブロック図。
【符号の説明】
1 光電変換部 2 2値化パターンメモリ 3 投影処理部 4 第1の文字切出し部 5 輪郭トレース部 6 輪郭トレース座標メモリ部 7 第2の文字切出し部
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G06K 9/34

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 紙葉類上の文字を光学的に走査して得ら
    れる文字パターンに対し投影処理を行い投影データを得
    る手段と、 得られた投影データおよび予め設定された1文字切出位
    置情報に応じて、前記文字パターンを1文字ごとに切り
    出す切出手段と、 前記切出手段による文字切出処理の結果において、前記
    文字パターンに対する切出面に接触する隣接した文字パ
    ターンに対してのみ輪郭処理を行い、該隣接した文字パ
    ターンを分離する分離手段 とを備えることを特徴とする
    光学文字切出し装置。
  2. 【請求項2】 前記分離手段は、 前記投影処理により得られる投影データ、前記1文字切
    出位置情報および前記輪郭処理により得られる輪郭座標
    情報に基づいて、前記隣接した文字パターンを分離する
    ことを特徴とする請求項1記載の光学文字切出し装置。
JP5304198A 1993-12-03 1993-12-03 光学文字切出し装置 Expired - Lifetime JP2929919B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5304198A JP2929919B2 (ja) 1993-12-03 1993-12-03 光学文字切出し装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5304198A JP2929919B2 (ja) 1993-12-03 1993-12-03 光学文字切出し装置

Publications (2)

Publication Number Publication Date
JPH07160813A JPH07160813A (ja) 1995-06-23
JP2929919B2 true JP2929919B2 (ja) 1999-08-03

Family

ID=17930203

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5304198A Expired - Lifetime JP2929919B2 (ja) 1993-12-03 1993-12-03 光学文字切出し装置

Country Status (1)

Country Link
JP (1) JP2929919B2 (ja)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04329492A (ja) * 1991-05-01 1992-11-18 Ricoh Co Ltd 文字切り出し方法

Also Published As

Publication number Publication date
JPH07160813A (ja) 1995-06-23

Similar Documents

Publication Publication Date Title
JP2812982B2 (ja) 表認識方法
JP2929919B2 (ja) 光学文字切出し装置
JP4078045B2 (ja) 画像処理装置、方法、プログラム、及び記憶媒体
JP2796561B2 (ja) 表形式文書認識方式
JP2957729B2 (ja) 行方向判定装置
JP2888885B2 (ja) 文字切出し装置
JPH0522947B2 (ja)
JP2877380B2 (ja) 光学的文字読取装置
JP3163698B2 (ja) 文字認識方法
JP4040231B2 (ja) 文字抽出方法及び装置並びに記憶媒体
JP2909132B2 (ja) 光学的文字読取装置
JPH0373916B2 (ja)
JP3196603B2 (ja) バーコード認識方法及びシステム
JPH0721816B2 (ja) 文字イメージ抽出処理装置
JP3566738B2 (ja) 網掛け領域処理方法および網掛け領域処理装置
JP3047857B2 (ja) 光学式文字読み取り装置
JP2957774B2 (ja) 行方向判定装置
JPH10162104A (ja) 文字認識装置
JPH0244487A (ja) 光学文字読取装置の7b文字読取方式
JPS62290984A (ja) パタ−ン情報入力用紙、及び、該用紙を用いたパタ−ン情報認識方法
JPS62134767A (ja) 記号名・線分名の自動抽出装置
JPH05128305A (ja) 領域分割方法
JPH0266681A (ja) 図面処理装置
JP3199033B2 (ja) 光学式文字読取方法、及び光学式文字読取装置
JPS6327990A (ja) 文字認識方法

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19990420

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090521

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100521

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110521

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110521

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120521

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120521

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130521

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140521

Year of fee payment: 15

EXPY Cancellation because of completion of term