JPH07160813A - 光学文字切出し装置 - Google Patents

光学文字切出し装置

Info

Publication number
JPH07160813A
JPH07160813A JP5304198A JP30419893A JPH07160813A JP H07160813 A JPH07160813 A JP H07160813A JP 5304198 A JP5304198 A JP 5304198A JP 30419893 A JP30419893 A JP 30419893A JP H07160813 A JPH07160813 A JP H07160813A
Authority
JP
Japan
Prior art keywords
character
pattern
contour
unit
compressed data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5304198A
Other languages
English (en)
Other versions
JP2929919B2 (ja
Inventor
Kazuhito Nakanishi
和仁 中西
Daisuke Nishiwaki
大輔 西脇
Toshiharu Asano
敏晴 浅野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP5304198A priority Critical patent/JP2929919B2/ja
Publication of JPH07160813A publication Critical patent/JPH07160813A/ja
Application granted granted Critical
Publication of JP2929919B2 publication Critical patent/JP2929919B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【目的】光学文字切出し装置において、予め指定された
切出し枠よりはみでている文字や、重なっている文字な
どを正確に切り出すことができるようにする。 【構成】紙葉類等に記載された文字を光学的に走査し、
その走査信号を電気的2値信号に変換する光電変換部1
と、2値化した文字パターンを記憶する2値化パターン
メモリ部2と、予め指定された1文字切出し情報8に従
って前記2値化パターンメモリ部の文字パターンを1文
字毎に投影処理を行い圧縮データを求める投影処理部3
と、前記圧縮データ及び予め指定された1文字切出し位
置情報8に従って文字を切り出す第1の文字切出し部4
と、文字パターンが切断面に接している場合にはその文
字パターンの輪郭をトレースする輪郭トレース部5と、
前記輪郭トレース部で求められた輪郭画素情報の座標値
を記憶する輪郭トレース座標メモリ部6と、前記輪郭ト
レース座標メモリ部6及び、前記1文字切出し位置情報
8及び、前記圧縮データに従って文字を切り出す第2の
文字切出し部7から構成される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字を光学的に読み取
る装置に関し、特に帳票上に記載された文字を一文字分
ごとに切り出す光学文字切出し装置に関する。
【0002】
【従来の技術】従来この種の文字切出し装置は、帳票上
に記載された文字を、予め指定された1文字切出し位置
情報及び周囲の文字パターンより投影処理を行い1文字
切出しを行っていた(例えば、特開昭63−57831
号公報)。
【0003】この種の投影処理による切出し方法につい
て図2,図6及び図7を用いて詳細に説明する。
【0004】図7は投影処理を用いた1文字切出し方法
のブロック図である。光学変換部1は、光学変換素子及
びA−D変換回路からなり、帳票上に記載された文字パ
ターンイメージを読取り、2値化電気信号に変換する。
光電変換部1により2値化された文字パターンは2値化
パターンメモリ部2に記憶される。投影処理部3は記憶
された2値化文字パターンのx軸データをy方向に投影
処理して圧縮データを求める。文字切出し部4はこの圧
縮データより1文字ブロックと判定し、予め指定された
1文字切出し位置情報8に基づいて1文字の切出しを行
っていた。
【0005】図2は重なり文字の入力パターンを示す図
及び、その圧縮データ(a)を示している。圧縮データ
(a)より1文字ブロックと判定し、予め指定された1
文字切出し位置情報S0より切出し面S1にて切断し、
図6に示すような1文字の切出し結果が得られる。
【0006】しかしながら、投影処理のみにより1文字
切出しを行う光学文字切出し装置は、文字パターンのデ
ータを圧縮パターンを用いて1文字切出しを行うため、
1文字切出し位置情報よりはみでている文字や、重なっ
ている文字は、強制的に文字が切断されるため有効なデ
ータが失われてしまったり、隣接位置にある文字の一部
が残ってしまうという問題点があった。
【0007】この問題点を解決するために、2値化パタ
ーンを投影処理せず、各文字パターンについて輪郭トレ
ースを行うことによって1文字の切出しを行う手段が
(例えば特開平1−156888)公報に提供されてい
る。
【0008】この種の、全文字パターンについて輪郭ト
レースを行うことによって1文字の切出しを行う光学文
字切出し装置について図8を用いて説明する。
【0009】帳票上に記載された文字イメージは光学変
換素子及びA−D変換回路からなる光電変換部1によ
り、2値化電気信号に変換され、この2値化された文字
パターンは2値化パターンメモリ部2に記憶される。輪
郭トレース部5は文字パターンの画素情報について1画
素毎の画像データの輪郭となる画素を抽出してトレース
を行い、この画素情報の座標値は輪郭トレース座標メモ
リ部6に記憶される。文字切出し部7はこの輪郭トレー
ス座標メモリ部6から出力される輪郭画素情報の座標値
と、予め指定された1文字切出し位置情報8に基づいて
文字切出しを行う。
【0010】
【発明が解決しようとする課題】従来の投影処理のみに
より1文字切出しを行う光学文字切出し装置は、文字パ
ターンのデータを圧縮パターンを用いて1文字切出しを
行うため、1文字切出し位置情報よりはみでている文字
や、重なっている文字は、強制的に文字が切断され有効
なデータが失われてしまったり、隣接位置にある文字の
一部が残ってしまうという問題点があった。
【0011】また、投影処理を行わず、各文字パターン
について輪郭トレースを行うことによって文字を切出す
光学文字切出し装置は、全ての文字に対して輪郭トレー
スを行うため処理速度がかなり遅くなってしまい、さら
に、輪郭画素情報の座標値をメモリ部に記憶させるた
め、文字ブロックが多くなるほどメモリが大量に必要に
なってしまうという問題点があった。
【0012】
【課題を解決するための手段】上記問題点を解決するた
めに、本発明による光学文字切出し装置は、紙葉類等に
記載された文字を光学的に走査し、その走査信号を電気
的2値信号に変換する光電変換部と、2値化した文字パ
ターンを記憶する2値化パターンメモリ部と、予め指定
された1文字切出し情報に従って前記2値化パターンメ
モリ部の文字パターンを1文字毎に投影処理を行い圧縮
データを求める投影処理部と、前記圧縮データ及び予め
指定された1文字切出し位置情報に従って文字を切り出
す第1の文字切出し部と、文字パターンが切断面に接し
ている場合にはその文字パターンの輪郭をトレースする
輪郭トレース部と、前記輪郭トレース部で求められた輪
郭画素情報の座標値を記憶する輪郭トレース座標メモリ
部と、前記輪郭座標メモリ部及び、前記1文字切出し位
置情報及び、前記圧縮データに従って文字を切り出す第
2の文字切出し部とを有することを特徴とする。
【0013】
【実施例】次に、本発明について図面を参照して説明す
る。
【0014】図1は本発明の一実施例を示すブロック図
である。帳票上に記載された文字イメージは光学変換素
子及びA−D変換回路からなる光電変換部1により、2
値化電気信号に変換され、この2値化された文字パター
ンは2値化パターンメモリ部2に記憶される。投影処理
部3において2値化文字パターンのx軸データはy方向
に投影処理され、圧縮データ9が求められる。第1の文
字切出し部4はこの圧縮データ9より1文字ブロックと
判定し、帳票上に印刷された枠などの予め指定された1
文字切堕し位置情報8に基づいて1文字の切出しを行
う。文字パターンが切断面に接している場合には輪郭ト
レース部5においてその文字パターンの輪郭をトレース
し、輪郭トレース部5で求められた輪郭画素情報の座標
値を輪郭トレース座標メモリ部6に記憶する。第2の文
字切出し部7は輪郭トレース座標メモリ部6に記憶され
た輪郭画素情報の座標値、1文字切出し位置情報8及
び、圧縮データ9に従って文字を切り出す。
【0015】図2は重なり文字の入力パターンA,Bを
示す図及び、投影処理部3において求められた圧縮デー
タ(a)を示している。この圧縮データ(a)及び予め
指定された1文字切出し位置情報に基づいて第1の文字
切出し部4にて1文字の切出しを行うのであるが、この
際、図2の文字パターンA,Bのように切出し面S1に
文字パターンが接している場合はそれぞれの文字パター
ンに対して輪郭トレース部5にて輪郭トレースを行う。
【0016】次に図2,図3及び図4を用いて輪郭トレ
ース手段の一実施例を説明する。図2においてP0
(0,0)はトレース中心パターン座標であり、ここか
らx軸方向に1ラインずつ黒パターンが開始する点(a
s)及び黒パターンが終了する点(ae)のx座標を輪
郭トレース座標メモリ部6に記憶する。この作業をy方
向に1ラインずつずらしながらトレースエリア全てに対
して行い、図3に示すようにbs,be,cs,ce,
…と求めて輪郭トレース座標メモリ部6に記憶してい
く。そして、連続する2つのラインの黒パターンについ
て、前ラインの黒パターン開始点のx座標をKs、黒パ
ターン終了点のx座標をKe、後ラインについても同様
にLa,Leとしたとき、図4の接触パターンより接触
条件Ks≦Le+1かつKe+1≧Lsを満たしている
場合は、その連続する2つのラインの黒パターンは同じ
文字ブロックの構成要素であると判定し、この接触条件
を満たしていない場合は、その連続する2つのラインの
黒パターンは異なる文字ブロックの構成要素であると判
定する。このようにして全トレースエリア内の黒パター
ンをそれぞれブロックに分ける。次に、図3に示すよう
な各ブロックのx方向の最小x座標Axmin、Bxm
in、及び最大x座標Axmax、Bxmaxをそれぞ
れ求める。同様にy方向についても最小y座標Aymi
n、Bymin及び最大y座標Aymax、Bymax
をそれぞれ求める。
【0017】各ブロックのx,y方向の最小及び、最大
座標位置が求まり、これにより第2の文字切出し部7に
おいて図5に示すような2つの文字ブロックに切り離
す。
【0018】ここで輪郭トレース手段の一実施例を示し
たが本願発明の効果を得るためにはこのトレース手段に
限られるわけではなく、例えば、特開平1−15688
8号に開示されているような2値化された文字パターン
に対して1画素毎に黒パターンを検出し、その文字パタ
ーンの輪郭をトレースしていく手段でもかまわない。
【0019】また、上記実施例においては文字切出し部
を第1の文字切出し部と第2の文字切出し部の2つに分
けたが、必ずしも分ける必要はなく、1つの文字切出し
部において2回の切出しを行ってもよい。
【0020】また、文字パターンを切り出す際に予め定
められた1文字切出し位置情報がない場合、つまり、自
由手書き文字を切り出す場合においても、本発明の光学
文字切出し装置は、帳票上に記載された自由手書き文字
のイメージは光学変換素子及びA−D変換回路からなる
光電変換部1により、2値化電気信号に変換され、この
2値化された文字パターンは2値化パターンメモリ部2
に記憶される。投影処理部3において2値化文字パター
ンのx軸データはy方向に投影処理され、圧縮データが
求められ、圧縮データが途切れている部分で第一の切出
しを行い、得られた圧縮データが1行サイズを考えて長
すぎる場合は、この部分が複数の文字パターンが重なっ
ている部分か、または、その影が重なっている部分と判
断し、その部分の文字パターンに関してのみ輪郭トレー
ス部5において輪郭トレースを行い、輪郭トレース部5
で求められた輪郭画素情報の座標値を輪郭トレース座標
メモリ部6に記憶し、輪郭トレース座標メモリ部6に記
憶された輪郭画素情報の座標値及び、圧縮データに従っ
て第2の文字切出し部7において文字を切り出すという
処理を行うことにより十分な効果が得られる。
【0021】
【発明の効果】以上説明したように本発明による光学文
字切出し装置は、文字パターンを一度投影処理を行い、
予め指定された切断面に接しているパターンに関しての
み輪郭トレースを行い、文字を切り出すという処理を行
うことにより、予め指定された切出し枠からはみ出して
いる文字や、重なっている文字に対して有効なデータが
失われたり、隣接文字の一部が残り誤認識されたりする
ことがなく正確に文字を切り出すことができ文字認識の
精度が向上する効果があると共に、投影処理を行うこと
により切断面に接触しない文字パターンに関しては輪郭
トレースを行わないため、切出し処理速度が向上し、ま
た、輪郭画素情報の座標値を記憶させるために必要なメ
モリに関しても輪郭トレースのみの処理を行う場合に比
べて小量ですむという利点がある。
【図面の簡単な説明】
【図1】本発明の一実施例を示すブロック図。
【図2】投影処理及び輪郭トレース処理を行う文字パタ
ーン情報図。
【図3】輪郭トレースを行う文字パターンを示す図。
【図4】各黒パターン座標の前ラインとの接触条件を示
す図。
【図5】輪郭トレース処理により切り出された文字パタ
ーンを示す図。
【図6】投影処理により切り出された文字パターンを示
す図。
【図7】従来の投影処理のみによる光学文字切出し装置
を示すブロック図。
【図8】従来の輪郭トレース処理のみによる光学文字切
出し装置を示すブロック図。
【符号の説明】
1 光電変換部 2 2値化パターンメモリ 3 投影処理部 4 第1の文字切出し部 5 輪郭トレース部 6 輪郭トレース座標メモリ部 7 第2の文字切出し部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 紙葉類等に記載された文字を光学的に走
    査し、その走査信号を電気的2値信号に変換する光電変
    換部と、2値化した文字パターンを記憶する2値化パタ
    ーンメモリ部と、予め指定された1文字切出し情報に従
    って前記2値化パターンメモリ部の文字パターンを1文
    字毎に投影処理を行い圧縮データを求める投影処理部
    と、前記圧縮データ及び予め指定された1文字切出し位
    置情報に従って文字を切り出す第1の文字切出し部と、
    前記2値化パターンメモリに記憶された文字パターンの
    輪郭をトレースする輪郭トレース部と、前記輪郭トレー
    ス部で求められた輪郭画素情報の座標値を記憶する輪郭
    トレース座標メモリ部と、前記画素情報の座標値に従っ
    て文字を切り出す第2の文字切出し部とを有することを
    特徴とする光学文字切出し装置。
  2. 【請求項2】 前記輪郭トレース部は、前記第1の文字
    切出し部で文字パターンが切り出された後にその切出し
    面にその文字パターンが接触しているか否かを判定し、
    接触している場合に限りその文字パターンの輪郭をトレ
    ースすることを特徴とする前記請求項1に記載の光学文
    字切出し装置。
JP5304198A 1993-12-03 1993-12-03 光学文字切出し装置 Expired - Lifetime JP2929919B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5304198A JP2929919B2 (ja) 1993-12-03 1993-12-03 光学文字切出し装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5304198A JP2929919B2 (ja) 1993-12-03 1993-12-03 光学文字切出し装置

Publications (2)

Publication Number Publication Date
JPH07160813A true JPH07160813A (ja) 1995-06-23
JP2929919B2 JP2929919B2 (ja) 1999-08-03

Family

ID=17930203

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5304198A Expired - Lifetime JP2929919B2 (ja) 1993-12-03 1993-12-03 光学文字切出し装置

Country Status (1)

Country Link
JP (1) JP2929919B2 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04329492A (ja) * 1991-05-01 1992-11-18 Ricoh Co Ltd 文字切り出し方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04329492A (ja) * 1991-05-01 1992-11-18 Ricoh Co Ltd 文字切り出し方法

Also Published As

Publication number Publication date
JP2929919B2 (ja) 1999-08-03

Similar Documents

Publication Publication Date Title
JPH07160813A (ja) 光学文字切出し装置
JP2001109887A (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
JP2796561B2 (ja) 表形式文書認識方式
JPH07230525A (ja) 罫線認識方法及び表処理方法
JP2957729B2 (ja) 行方向判定装置
JPH0373916B2 (ja)
JP2888885B2 (ja) 文字切出し装置
JP2964980B2 (ja) 光学的文字認識における直線成分検出方法及び装置
JP3047857B2 (ja) 光学式文字読み取り装置
JPS61190679A (ja) 文字デ−タ処理装置
JPH05128305A (ja) 領域分割方法
JPH0398185A (ja) 文字読取装置における文字切り出し方法
JP3275475B2 (ja) 文字配列が既知の対象文字列の認識装置
JP3196603B2 (ja) バーコード認識方法及びシステム
JP2957774B2 (ja) 行方向判定装置
JP3566738B2 (ja) 網掛け領域処理方法および網掛け領域処理装置
JP2925270B2 (ja) 文字読取装置
JPH0728933A (ja) 文字認識装置
JPS6361387A (ja) 文字切り出し方法
JPS6149554A (ja) 画像切り出し回路
JPH05242297A (ja) 文字切り出し方法
JPH1011539A (ja) 光学式文字読取装置における画像処理方法
JPS63128490A (ja) 文字イメージ抽出処理装置
JPS59161768A (ja) 閉領域頂点抽出処理方式
JPH06333089A (ja) 光学文字読取装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19990420

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090521

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100521

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110521

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110521

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120521

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120521

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130521

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140521

Year of fee payment: 15

EXPY Cancellation because of completion of term