JPH06333088A - 光学文字読取装置 - Google Patents

光学文字読取装置

Info

Publication number
JPH06333088A
JPH06333088A JP5117979A JP11797993A JPH06333088A JP H06333088 A JPH06333088 A JP H06333088A JP 5117979 A JP5117979 A JP 5117979A JP 11797993 A JP11797993 A JP 11797993A JP H06333088 A JPH06333088 A JP H06333088A
Authority
JP
Japan
Prior art keywords
character
image data
image
area
line segment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP5117979A
Other languages
English (en)
Inventor
Takushi Senzaki
卓志 先崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Engineering Ltd
Original Assignee
NEC Engineering Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Engineering Ltd filed Critical NEC Engineering Ltd
Priority to JP5117979A priority Critical patent/JPH06333088A/ja
Publication of JPH06333088A publication Critical patent/JPH06333088A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【目的】 この発明の目的は、入力文字画像が複数文字
の線分が重なり合って連なった重なり文字の場合でも正
確な独立文字を切り出して認識することを可能とした光
学文字読取装置を提供することにある。 【構成】 画像入力回路100は光学的走査により文字
列画像データを入力する。文字切り出し回路200はこ
の画像入力回路100からの文字列画像データから各文
字毎の独立文字画像データを切り出し出力し、独立した
1文字が切り出せない場合には、重なりの存在が推定さ
れる特定範囲の重なり領域画像を抽出し、この重なり領
域画像から隣文字からのはみ出し線分を検出して除去し
た後、文字列画像データから重なり領域部分を除いた残
りの画像と合成し、この合成画像を独立文字画像データ
として出力する。文字判定回路300は文字切り出し回
路200で切り出された独立文字画像データを文字判定
する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、特に手書きの重なり
文字を光学的に読み取る光学文字読取装置に関する。
【0002】
【従来の技術】従来の光学文字読取装置は、画像入力回
路、文字切り出し回路及び文字判定回路で構成される。
例えば、画像入力回路で図4(a)に示すような文字画
像D10が得られた場合には、文字切り出し回路におい
て、入力文字画像D10に対して連続文字幅W10から
推定される文字数で等分した推定文字分割位置C10で
切り出すことで、図4(b)に示すような独立文字画像
データD11,D12を作成し、文字判定回路で各独立
文字画像データの判定を行うようにしている。
【0003】
【発明が解決しようとする課題】しかしながら、従来の
光学文字読取装置では、文字切り出し回路が予め設定さ
れた独立文字分離推定位置C10のみの情報で強制的に
切り出しているため、隣の文字の不要な線分が入り込
み、図4(b)に示すような不良独立文字画像データD
11,D12が出力されてしまうという問題点があっ
た。
【0004】以上述べたように従来の光学文字読取装置
では、文字切り出し回路が予め設定された独立文字分離
推定位置のみの情報で強制的に切り出しているため、隣
の文字の不要な線分が入込み、不良独立文字画像データ
が出力されてしまうという問題点があった。
【0005】この発明は上記の課題を解決するためにな
されたもので、入力文字画像が複数文字の線分が重なり
合って連なった重なり文字の場合でも正確な独立文字を
切り出して認識することを可能とした光学文字読取装置
を提供することを目的とする。
【0006】
【課題を解決するための手段】上記目的を達成するため
にこの発明に係る光学文字読取装置は、文字が記入され
た帳票を光学的に走査して文字列画像データを入力する
画像入力回路と、文字列画像データから各文字毎の独立
文字画像データを切り出して出力し、独立した1文字が
切り出せない場合には、重なりの存在が推定される特定
範囲の重なり領域画像を抽出し、この重なり領域画像か
ら隣文字からのはみ出し線分を検出して除去した画像と
前記文字列画像データから重なり領域部分を除いた残り
の画像とを合成し、この合成画像を独立文字画像データ
として出力する文字切り出し回路と、この文字切り出し
回路から出力される独立文字画像データにより文字判定
を行う文字判定回路とを具備して構成される。
【0007】特に、上記文字切り出し回路は、文字列画
像データを格納する第1のメモリと、この第1のメモリ
に格納された文字列画像データから各文字毎の独立文字
画像データを切り出して出力し、独立した1文字が切り
出せない場合には連続範囲内の文字列画像データを第2
のメモリに格納する文字切り出し手段と、第2のメモリ
に格納された連続範囲内の文字列画像データから重なり
領域画像を抽出して第2のメモリに格納する重なり領域
抽出手段と、第2のメモリに格納された重なり領域画像
から文字を構成する線分の領域を切り出して文字配列方
向の座標値と重なり領域画像の一方端と他方端との位置
関係により、一方の隣接文字からのはみ出し線分領域で
あるか、他方の隣接文字からのはみ出し線分領域である
かを示すはみ出し線分領域情報を抽出するはみ出し線分
領域情報抽出手段と、はみ出し線分領域情報により重な
り領域画像から不要のはみ出し線分を除去した重なり線
分除去画像データを前記第2のメモリに格納するはみ出
し線分除去手段と、第2のメモリに格納された連続範囲
内の文字列画像データから重なり領域を除いた残りの1
文字分の領域画像データと第2のメモリに格納された重
なり線分除去画像データをつなぎ合わせた重なり分離画
像データを独立文字画像データとして出力する文字領域
合成手段と、文字切り出し手段から出力される独立文字
画像データ及び文字領域合成手段から出力される独立文
字画像データを格納する第3のメモリとを備えることを
特徴とする。
【0008】
【実施例】以下、図面を参照してこの発明の一実施例を
詳細に説明する。
【0009】図1はこの発明に係る光学文字読取装置の
構成を示すブロック図、図2は図1に示した文字切り出
し回路の具体的な構成を示すブロック図、図3は図2に
示した文字切り出し回路の動作を説明するための図であ
る。
【0010】図1において、画像入力回路100は供給
された文字列画像を光学的に走査して文字列画像データ
に変換する。文字切り出し回路200は画像入力回路1
00からの文字列画像データに対して縦と横の2方向か
ら投影を行い、投影の結果を処理して各独立文字画像を
出力する。文字判定回路300は文字切り出し回路20
0から出力された各独立文字画像に対して各文字を判定
する。
【0011】文字切り出し回路200は、図2に示すよ
うに、メモリ201,202,203と、文字切り出し
部204と、重なり領域抽出部205と、はみ出し線分
領域情報抽出部206と、はみ出し線分除去部207
と、文字領域合成部208と、バス209と、通信路2
10,211,212,213とから構成される。
【0012】第1のメモリ201は、画像入力回路10
0にて光電変換された文字列画像データを格納する。こ
こでは、文字列画像データに複数文字の線分が重なり合
って連なった重なり文字が含まれているものとする。
【0013】文字切り出し部204は、通信路210を
介して第1のメモリ201と接続され、この第1のメモ
リ201に格納された文字列画像データから各文字毎の
独立文字画像データを切り出す。ここで得られた独立文
字画像データは通信路211を介して第3のメモリ20
3に格納される。
【0014】また、文字切り出し部204は、独立した
1文字が切り出せない場合には連続範囲内の文字列画像
データを取り出す。ここで取り出された連続範囲内の文
字列画像データはバス209を介して第2のメモリ20
2に格納される。
【0015】重なり領域抽出部205は、第2のメモリ
202に格納された連続範囲内の文字列画像データから
重なりの存在が推定される領域を抽出する。ここで抽出
した重なり領域画像データはバス209を介して第2の
メモリ202に格納される。
【0016】はみ出し線分領域情報抽出部206は、第
2のメモリ202に格納された重なり領域画像データか
ら文字を構成する線分の領域を取り出して、X方向(こ
こでは水平方向とする)座標値と重なり領域画像データ
の左端と右端との位置関係により、左隣文字からのはみ
出し線分領域であるか、右隣文字からのはみ出し線分領
域であるかを示すはみ出し線分領域情報を抽出する。こ
こで抽出されたはみ出し線分領域情報は通信路212を
介してはみ出し線分除去部207に送られる。
【0017】はみ出し線分除去部207は、はみ出し線
分領域情報により第2のメモリ202に格納された重な
り領域画像データから不要のはみ出し線分を除去して重
なり線分除去画像データを得る。この重なり線分除去画
像データはメモリ202に格納される。
【0018】文字領域合成部208は、第2のメモリ2
02に格納された連続範囲内の文字列画像データから重
なり領域を除いた残り1文字分の領域画像データと同じ
く第2のメモリ202に格納された重なり線分除去画像
データを合成して重なり分離画像データを生成する。こ
の重なり分離画像データは、独立文字画像データとし
て、通信路213を介して第3のメモリ203に格納さ
れる。
【0019】上記構成において、以下図3(a)乃至
(e)を参照してその動作を説明する。尚、文字切り出
し回路200以外は公知の技術であるので、ここではそ
の詳細な説明を省略する。
【0020】すなわち、文字切り出し回路200におい
て、画像入力回路100から図3(a)に示す入力文字
画像D1が入力されたとする。この入力文字画像D1は
第1のメモリ201に格納される。
【0021】すると、文字切り出し部204が動作し
て、入力文字画像D1について縦と横の2方向からの投
影を行い、その投影結果から当該画像D1は独立した1
文字が切り出せないと判断する。
【0022】次に、重なり領域抽出部205が動作し
て、入力文字画像D1について縦と横の2方向から投影
を行い、独立した黒ブロックB1,B2を切り出す。そ
して、領域X方向(水平方向)座標値が重なり領域画像
D2の左端に接していることを判別して左はみ出し線分
領域情報I1を抽出すると共に、切り出した領域のX方
向(水平方向)座標値が重なり領域画像D2の右端に接
していることを判別して右はみ出し線分領域情報I2を
抽出する。
【0023】次に、はみ出し線分除去部207が動作し
て、重なり領域画像D2から右はみ出し線分領域情報I
2に対応する黒ブロックB2を消去して右重なり線分除
去画像D3を得ると共に、重なり領域画像D2から左は
み出し線分領域情報I1に対応する黒ブロックB1を消
去した左重なり線分除去画像D4を得る。
【0024】次に、文字領域合成部が208が動作し
て、入力文字列画像D1から重なり許容幅(重なり領
域)W1を除いた残りの1文字分の領域画像(残り1文
字分領域W2、W3の範囲の画像)と重なり線分除去画
像D3,D4を合成することで、重なり分離画像D5,
D6を得る。この重なり分離画像D5,D6は独立文字
画像として第3のメモリ203に格納される。
【0025】この第3のメモリ203には重なりのない
独立文字画像D5,D6が格納されるので、文字判定回
路300は第3のメモリ203に格納された独立文字画
像について文字判定を正確に実行し得る。
【0026】このように、文字切り出し回路200はメ
モリ201に格納された入力文字画像D1から重なり領
域画像D2を抽出し、重なり領域画像D2から検出した
はみ出し線分領域情報I1,I2を用いて、隣文字から
のはみ出し線分を重なり領域画像D2から除去した重な
り線分除去画像D3,D4を作成し、入力文字画像D1
から重なり許容幅(重なり領域)W1を除いた残り1文
字分の領域画像と重なり線分除去画像D3,D4を合成
して重なり分離画像D5,D6を生成し、これを独立文
字画像としてメモリ203に格納するようにしているの
で、入力文字画像D1に複数文字の線分が重なり合って
連なった重なり文字が存在しても正確な独立文字画像を
切り出すことができる。
【0027】したがって、上記構成による光学文字読取
装置は、文字が記入された帳票から読み取った文字列画
像データから重なり領域画像を抽出し、重なり領域画像
から検出した重なり線分領域情報を用いて隣文字からの
はみ出し線分を重なり領域画像から除去した重なり線分
除去画像を作成し、入力文字列画像から重なり領域を除
いた残り1文字分の領域画像と重なり線分除去画像を合
成した重なり分離文字画像を独立文字画像として文字判
定を行うようにしたので、入力文字画像に複数文字の線
分が重なり合って連なった重なり文字が存在しても、正
確な独立文字を切り出すことができ、これによって正確
な文字鑑定が可能となる。
【0028】尚、この発明は上記実施例に限定されるも
のではなく、その他この発明の要旨を逸脱しない範囲で
種々変形しても同様に実施可能である。
【0029】
【発明の効果】以上述べたようにこの発明によれば、入
力文字画像が複数文字の線分が重なり合って連なった重
なり文字の場合でも正確な独立文字を切り出して認識す
ることを可能とした光学文字読取装置を提供することが
できる。
【図面の簡単な説明】
【図1】この発明に係る光学文字読取装置の一実施例の
構成を示すブロック図である。
【図2】同実施例の文字切り出し回路の具体的な構成を
示すブロック図である。
【図3】図2に示した文字切り出し回路の動作を説明す
るための図である。
【図4】従来の光学文字読取装置の文字切り出し方法を
説明するための図である。
【符号の説明】
100 画像入力回路 200 文字切り出し回路 201 第1のメモリ 202 第2のメモリ 203 第3のメモリ 204 文字切り出し部 205 重なり領域抽出部 206 はみ出し線分領域情報抽出部 207 はみ出し線分除去部 208 文字領域合成部 209 バス 210,211,212,213 通信路 300 文字判定回路

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 文字が記入された帳票を光学的に走査し
    て文字列画像データを入力する画像入力回路と、 前記文字列画像データから各文字毎の独立文字画像デー
    タを切り出して出力し、独立した1文字が切り出せない
    場合には、重なりの存在が推定される特定範囲の重なり
    領域画像を抽出し、この重なり領域画像から隣文字から
    のはみ出し線分を検出して除去した画像と前記文字列画
    像データから重なり領域部分を除いた残りの画像とを合
    成し、この合成画像を独立文字画像データとして出力す
    る文字切り出し回路と、 この文字切り出し回路から出力される独立文字画像デー
    タにより文字判定を行う文字判定回路とを具備すること
    を特徴とする光学文字読取装置。
  2. 【請求項2】 前記文字切り出し回路は、 前記文字列画像データを格納する第1のメモリと、 この第1のメモリに格納された文字列画像データから各
    文字毎の独立文字画像データを切り出して出力し、独立
    した1文字が切り出せない場合には連続範囲内の文字列
    画像データを第2のメモリに格納する文字切り出し手段
    と、 前記第2のメモリに格納された連続範囲内の文字列画像
    データから前記重なり領域画像を抽出して前記第2のメ
    モリに格納する重なり領域抽出手段と、 前記第2のメモリに格納された重なり領域画像から文字
    を構成する線分の領域を切り出して文字配列方向の座標
    値と重なり領域画像の一方端と他方端との位置関係によ
    り、一方の隣接文字からのはみ出し線分領域であるか、
    他方の隣接文字からのはみ出し線分領域であるかを示す
    はみ出し線分領域情報を抽出するはみ出し線分領域情報
    抽出手段と、 前記はみ出し線分領域情報により前記重なり領域画像か
    ら不要のはみ出し線分を除去した重なり線分除去画像デ
    ータを前記第2のメモリに格納するはみ出し線分除去手
    段と、 前記第2のメモリに格納された連続範囲内の文字列画像
    データから重なり領域を除いた残りの1文字分の領域画
    像データと前記第2のメモリに格納された重なり線分除
    去画像データをつなぎ合わせた重なり分離画像データを
    独立文字画像データとして出力する文字領域合成手段
    と、 前記文字切り出し手段から出力される独立文字画像デー
    タ及び前記文字領域合成手段から出力される独立文字画
    像データを格納する第3のメモリとを備えることを特徴
    とする請求項1記載の光学文字読取装置。
JP5117979A 1993-05-20 1993-05-20 光学文字読取装置 Withdrawn JPH06333088A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5117979A JPH06333088A (ja) 1993-05-20 1993-05-20 光学文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5117979A JPH06333088A (ja) 1993-05-20 1993-05-20 光学文字読取装置

Publications (1)

Publication Number Publication Date
JPH06333088A true JPH06333088A (ja) 1994-12-02

Family

ID=14725016

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5117979A Withdrawn JPH06333088A (ja) 1993-05-20 1993-05-20 光学文字読取装置

Country Status (1)

Country Link
JP (1) JPH06333088A (ja)

Similar Documents

Publication Publication Date Title
US20020051574A1 (en) Character recognition method, program and recording medium
JP3615333B2 (ja) 罫線消去装置
JPH06333088A (ja) 光学文字読取装置
JPH0981740A (ja) 線図形入力装置
JP2796561B2 (ja) 表形式文書認識方式
JPS58197581A (ja) 文字図形認識方法とその装置
JP2003016385A (ja) 画像処理装置、方法、プログラム、及び記憶媒体
JPH0713994A (ja) 文字認識装置
JP3517077B2 (ja) パターン抽出装置及びパターン領域の切り出し方法
JPH09106437A (ja) 文字切出し装置および文字切出し方法
JP2722550B2 (ja) 光学文字読取装置
JP3337592B2 (ja) マーク位置検出装置およびマーク位置検出方法
JP3880091B2 (ja) 情報処理装置及び方法
JP2964980B2 (ja) 光学的文字認識における直線成分検出方法及び装置
JPH02128292A (ja) 光学文字読取装置
JP2925270B2 (ja) 文字読取装置
JPH03161888A (ja) 光学的文字読取装置
JPH1153469A (ja) 文字切り出し装置、光学式文字読取装置及び記録媒体
JPH05174185A (ja) 日本語文字認識装置
JP2906608B2 (ja) 光学的文字読取装置
JP3566738B2 (ja) 網掛け領域処理方法および網掛け領域処理装置
JPH05242297A (ja) 文字切り出し方法
JPH02311975A (ja) 光学文字読取装置
JPH10177621A (ja) 文書処理方法、罫線認識方法及び記録媒体
JP2002074266A (ja) 文字読取装置および文字読取方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20000801