JP2639165B2 - 文字切出装置 - Google Patents

文字切出装置

Info

Publication number
JP2639165B2
JP2639165B2 JP2070127A JP7012790A JP2639165B2 JP 2639165 B2 JP2639165 B2 JP 2639165B2 JP 2070127 A JP2070127 A JP 2070127A JP 7012790 A JP7012790 A JP 7012790A JP 2639165 B2 JP2639165 B2 JP 2639165B2
Authority
JP
Japan
Prior art keywords
character
density
memory
character frame
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2070127A
Other languages
English (en)
Other versions
JPH03269690A (ja
Inventor
祐司 篠崎
俊史 山内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP2070127A priority Critical patent/JP2639165B2/ja
Publication of JPH03269690A publication Critical patent/JPH03269690A/ja
Application granted granted Critical
Publication of JP2639165B2 publication Critical patent/JP2639165B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は文字切出装置に関し、得に文字枠が印刷され
た用紙に記入された文字を読取る光学文読取装置に設け
られて、各文字枠に記入された文字を切出す文字切出装
置に関する。
〔従来の技術〕 従来、この種の文字切出装置は、あらかじめ与えられ
る文字枠の位置情報により文字枠位置を推定し、各文字
枠内に記入された文字パターンを、文字枠の印刷色の濃
度から一定の範囲を越える濃度の画素を黒、その他の画
素を白とする2値画像から切出している。
〔発明が解決しようとする課題〕
上述した従来の文字切出装置は、あらかじめ与えられ
る文字枠位置情報により文字枠位置を推定しているの
で、文字枠位置情報に誤差があると、推定した文字枠位
置と実際の文字枠位置との間にずれが生じ、桁ずれや切
出不良が生じるという欠点がある。
第5図(1),(2)は従来の文字切出装置の問題点
を解決する図である。
第5図(1)に示す用紙3上の文字枠1a,1b,1c内に、
左から「1」、「ブランク」、「3」の順で文字が書か
れた入力画像に対して、文字枠位置情報として破線で示
す枠2a,2b,2cがあらかじめ与えられたとする。このと
き、従来の文字切出装置では、破線で示す枠2a,2b,2cに
従って、文字が切出されるため、切出された文字は、第
5図(2)に示す文字を入力したものと等価となる。
したがって、本来一桁目に切出す「1」という文字を
2桁目として切出すような桁ずれや、本来2桁目、3桁
目に切出す「ブランク」および「3」という文字が消失
したり欠けてしまうような切出不良が発生する。
本発明の目的は、桁ずれ、切出不良が生じない、精度
の高い文字切出装置を提供することにある。
〔課題を解決するための手段〕
本発明の文字切出装置は、入力画像の多値濃度データ
が格納される第1のメモリと、第2,第3のメモリと、第
1のメモリに格納されている多値濃度データを参照し、
各濃度の分布数から文字枠の濃度範囲および文字の濃度
範囲を求める文字枠・文字濃度検出回路と、入力画像の
うち、文字枠・文字濃度検出回路で検出された文字枠の
濃度範囲の画素を黒、その他の画素を白とする2値画像
を生成し、第2のメモリに格納する第1の2値画像生成
回路と、入力画像のうち、文字枠・文字濃度検出回路で
検出された文字の濃度範囲の画素を黒、その他の画素を
白とする2値画像を生成し、第3のメモリに格納する第
2の2値画像生成回路と、第2のメモリに格納されてい
る2値画像から文字枠の位置を検出し、第3のメモリに
格納されている2値画像のうち、検出された文字枠位置
内に含まれる2値画像の文字パターンを切出すパターン
切出回路とを有する。
〔作用〕
本発明の文字切出装置は、入力画像の多値濃度データ
を参照し、各濃度の分布数から文字枠の濃度範囲および
文字の濃度範囲を求め、入力画像のうち文字枠の濃度範
囲の画素を黒、その他の画素を白とする2値画素を生成
して文字枠の位置を自動的に検出し、この文字枠の位置
内に含まれる、入力画像のうち文字の濃度範囲の画素を
黒、その他の画素を白とする2値画像の文字パターンを
切出すことにより、桁ずれや切出不良を防ぐ。
〔実 施 例〕
次に、本発明の実施例について図面を参照して説明す
る。
第1図は本発明の文字切出装置の一実施例を示すブロ
ック図、第2図(1),(2),(3)、第3図、第4
図は第1図の文字切出装置の動作を説明する図である。
この文字切出装置100は、イメージセンサなどで入力
画素の各画素ごとの濃度を多値化した多値濃度データが
入力される入力端子80と、入力画像の多値濃度データが
格納される第1のメモリ10と、第2のメモリ30と、第3
のメモリ40と、第1のメモリ10に格納されている多値濃
度データを参照し、各濃度の分布数から文字枠の濃度範
囲および文字の濃度範囲を求める文字枠・文字濃度検出
回路20と、入力画像のうち、文字枠・文字濃度検出回路
20で検出された文字枠の濃度範囲の画素を黒、その他の
画素を白とする2値画像を生成し、第2のメモリ30に格
納する第1の2値画像生成回路50と、入力画像のうち、
文字枠・文字濃度検出回路20で検出された文字の濃度範
囲の画素を黒、その他の画素を白とする2値画像を生成
し、第3のメモリ40に格納する第2の2値画像生成回路
60と、第2のメモリ30に格納されている2値画像から文
字枠の位置を検出し、第3のメモリ40に格納されている
2値画像のうち、検出された文字枠位置内に含まれる2
値画像の文字パターンを切出すパターン切出回路70と、
パターン切出回路70で切出された文字パターンが出力さ
れる出力端子90とから構成される。
以下、第2図(1),(2),(3)、第3図、第4
図を用いて、この文字切出装置100の動作について説明
する。
第2図(1)に示す用紙3上の文字枠1a,1b内に書か
れた文字「2」と「3」の切出しを例として説明する。
ここで、各文字は文字枠1a,1bの印刷色の濃度よりも大
きい濃度で、白地の用紙3上に書かれる。
入力単位80から、イメージセンサなどにより多値化さ
れた用紙3上の各画素ごとの濃度を示す多値濃度データ
が入力される。入力端子80から入力された多値濃度デー
タは第1のメモリ10に格納される。文字枠・文字濃度検
出回路20で、第1のメモリ10に格納されたすべての画素
の多値濃度データより、濃度分布が求められる。文字の
濃度は文字枠1a,1bの印刷色の濃度よりも大きいため、
濃度分布は、第2図(2)に示すように用紙3の白地を
示す濃度0、文字枠1a,1bの濃度を示す濃度A、文字の
濃度を示すBに分布が集中する。したがって、この濃度
分布より文字枠の濃度範囲(第2図(2)では濃度Cと
濃度Dの範囲)および文字の濃度範囲(第2図(2)で
は濃度D以上の範囲)が求められる。第1の2値画像生
成回路50で、第1のメモリ10に格納されている各画素の
多値濃度データと濃度Cおよび濃度Dの大小比較が行な
われ文字枠の濃度範囲の濃度をもつ画素を黒(0)、そ
の他の画素を白(1)とする2値画像が生成される。こ
の2値画像は、文字枠1a,1bが黒で、用紙3の白地と文
字が白となるため、第2図(3)に示すように文字枠1
a,1bのみのデータとなる。この2値画像のデータは、第
2のメモリ30に格納される。第2の2値画像生成回路60
では、第1のメモリ10に格納されている各画素の多値濃
度データと濃度Dの大小比較が行なわれ、文字の濃度範
囲の濃度をもつ画素を黒(0)、その他の画素を白
(1)とする2値画像が生成され、第3のメモリ40に格
納される。この2値画像は、文字のみが黒で、用紙3と
文字枠1a,1bが白となるため、第3図に示すように文字
のみのデータとなる。
パターン切出回路70で、第2のメモリ30に格納されて
いる2値画像について、用紙3の水平方向および垂直方
向の黒の画素の分布数が求められ、第2図(3)に示す
分布図が得られる。その結果、この分布図の分布数のピ
ーク位置を求めることにより、文字枠1a,1bのX軸座標
(用紙3の水平方向)X1,X2,X3,X4およびY軸座標(用
紙3の垂直方向)Y1,Y2が検出される。また、文字枠1a
と文字枠1bの間には必ず分布数が0となるX座標が存在
するため、4隅の座標が(X1,Y1),(X1,Y2),(X2,Y
2),(X2,Y1)で表わされる文字枠1aと4隅の座標が
(X3,Y1),(X3,Y2),(X4,Y2),(X4,Y1)で表わさ
れる文字枠1bとを分離することができる。したがって、
第4図に示すように、第3図のメモリ40に格納された文
字のみ黒で表わされている2値画像のデータから、上記
した4隅の座標内にある各画像のデータを順次取出すこ
とにより、文字パターンの切出しが行なえる。すなわ
ち、4隅の座標が(X1,Y1),(X1,Y2),(X2,Y2),
(X2,Y1)内(第4図左下りの斜線内)の各画素のデー
タを取出すことにより文字パターン「2」が切出され、
4隅の座標が(X3,Y1),(X3,Y2),(X4,Y2),(X4,
Y1)内(第4図右下りの斜線内)の各画素のデータを取
出すことにより、文字パターン「3」が切出される。こ
のようにして切出した文字パターンは、出力端子70から
文字読取装置(図示せず)へ出力される。
したがって、この文字切出装置100では、文字枠1a,1b
の位置が自動的に検出され、検出された文字枠内にある
文字のみの2値画像が取出されることにより、文字パタ
ーンの切出しが行なわれるため、高い精度で文字の切出
しが行なえる。
以上の説明において、第2図(1)に示す2つの文字
の切出しを例としたが、1行当りの文字の数および行数
が多くても、文字切出装置100は、同様の動作を行なう
ことは言うまでもないであろう。また、文字枠のサイズ
にも影響されないことも、文字枠の4隅の座標を自動検
出することから容易に理解できるであろう。
〔発明の効果〕
以上説明したように本発明は、入力画像の多値濃度デ
ータの濃度分布から文字枠の位置を自動的に検出し、検
出した文字枠ごとに文字パターンを切出することによ
り、桁ずれ、切出不良が発生せず、文字切出しの精度が
向上するという効果があり、また、文字枠の4隅の座標
を求めることができるため、文字と文字の相対的な位置
関係も正確に求められることにより、文字と文字枠の相
対的な位置関係を特徴として判別する文字(例えば、カ
ンマとアポストロフィー)の判別精度も向上できる効果
がある。
【図面の簡単な説明】
第1図は本発明の文字切出装置の一実施例を示すブロッ
ク図、第2図(1),(2),(3)、第3図、第4図
は第1図の文字切出装置の動作を説明する図、第5図
(1),(2)は従来の文字切出装置の問題点を説明す
る図である。 1a,1b……文字枠、3……用紙、 10……第1のメモリ、 20……文字枠・文字濃度検出回路、 30……第2のメモリ、 40……第3のメモリ、 50……第1の2値画像生成回路、 60……第2の2値画像生成回路、 70……パターン切出回路、 80……入力端子、90……出力端子、 100……文字切出装置、 A,B,C,D……濃度、 X1,X2,X3,X4,Y1,Y2……座標。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】文字枠が印刷された用紙に記入された文字
    を読取る光学文字読取装置に設けられて、各文字枠に記
    入された文字を切出す文字切出装置であって、 入力画像の多値濃度データが格納される第1のメモリ
    と、 第2,第3のメモリと、 第1のメモリに格納されている多値濃度データを参照
    し、各濃度の分布数から文字枠の濃度範囲および文字の
    濃度範囲を求める文字枠・文字濃度検出回路と、 入力画像のうち、文字枠・文字濃度検出回路で検出され
    た文字枠の濃度範囲の画素を黒、その他の画素を白とす
    る2値画像を生成し、第2のメモリに格納する第1の2
    値画像生成回路と、 入力画像のうち、文字枠・文字濃度検出回路で検出され
    た文字の濃度範囲の画素を黒、その他の画素を白とする
    2値画像を生成し、第2のメモリに格納する第2の2値
    画像生成回路と、 第2のメモリに格納されている2値画像から文字枠の位
    置を検出し、第3のメモリに格納されている2値画像の
    うち、検出された文字枠位置内に含まれる2値画像の文
    字パターンを切出すパターン切出回路とを有する文字切
    出装置。
JP2070127A 1990-03-19 1990-03-19 文字切出装置 Expired - Fee Related JP2639165B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2070127A JP2639165B2 (ja) 1990-03-19 1990-03-19 文字切出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2070127A JP2639165B2 (ja) 1990-03-19 1990-03-19 文字切出装置

Publications (2)

Publication Number Publication Date
JPH03269690A JPH03269690A (ja) 1991-12-02
JP2639165B2 true JP2639165B2 (ja) 1997-08-06

Family

ID=13422578

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2070127A Expired - Fee Related JP2639165B2 (ja) 1990-03-19 1990-03-19 文字切出装置

Country Status (1)

Country Link
JP (1) JP2639165B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4585837B2 (ja) * 2004-11-24 2010-11-24 日立コンピュータ機器株式会社 印字データ読取り方法、印字データ読み取り装置、印字データ読み取りプログラム
JP5054472B2 (ja) * 2007-09-11 2012-10-24 日立コンピュータ機器株式会社 文字認識装置及び文字認識装置における文字認識方法

Also Published As

Publication number Publication date
JPH03269690A (ja) 1991-12-02

Similar Documents

Publication Publication Date Title
US5471549A (en) Method of detecting and correcting a direction of image data and document image filing system employing the same
US5444793A (en) Method for detecting machine printed monetary amounts in binary images
US5198907A (en) Method and appratus for automatically locating predefined exposure areas in a scanned image
US4901365A (en) Method of searching binary images to find search regions in which straight lines may be found
JP2502175B2 (ja) 原画像パタ―ンデ―タ再生方法及び装置
JP2639165B2 (ja) 文字切出装置
CN115249362A (zh) 基于像素在稳定方向上连通性的ocr表格识别方法及系统
JPH06131495A (ja) 画像情報抽出方式
JPH1196296A (ja) 帳票イメージ処理方法および装置
JP3498653B2 (ja) 帳票のマーク記入欄読取り装置及びそのマーク記入欄読取り方法
JPH06111057A (ja) 光学的文字読取装置
JPH0373916B2 (ja)
JP3412441B2 (ja) 画像処理装置
JP2617519B2 (ja) 光学文字読取り装置の文字切出し回路
JPH08194776A (ja) 帳票処理方法及び装置
JP2636866B2 (ja) 情報処理方法
JP2932387B1 (ja) 光学的読取り帳票の読取り方法及び読取り装置
JPH11301077A (ja) ドットコード評価装置及びドットコード評価方法
JP3381803B2 (ja) 傾き角検出装置
JPH0129643Y2 (ja)
JPH01245376A (ja) 文字読取装置の文字切出し装置
JP2001126025A (ja) Ocr用フォーマットパラメータ作成方法
JPS6298475A (ja) 印字品質検査方法
JPH04225474A (ja) イメージスキャナによる図面自動作製システム
JPH05266250A (ja) 文字列検出装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees