JPH03182985A - 文字読取装置 - Google Patents

文字読取装置

Info

Publication number
JPH03182985A
JPH03182985A JP1321297A JP32129789A JPH03182985A JP H03182985 A JPH03182985 A JP H03182985A JP 1321297 A JP1321297 A JP 1321297A JP 32129789 A JP32129789 A JP 32129789A JP H03182985 A JPH03182985 A JP H03182985A
Authority
JP
Japan
Prior art keywords
character
coordinates
rectangular coordinates
character string
black
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1321297A
Other languages
English (en)
Inventor
Masato Suda
正人 須田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP1321297A priority Critical patent/JPH03182985A/ja
Publication of JPH03182985A publication Critical patent/JPH03182985A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的コ (産業上の利用分野) 本発明は、文字列から任意の文字を検出切出しする文字
読取装置に関する。
(従来の技術) 一般に、文字読取装置においては、文字単位の識別処理
のために、識別処理の前段において、検出された文字列
から各文字単位への分離が必要である。そのため、文字
列から各文字単位への分離を行なう場合、−膜内には、
文字列と垂直方向に射影量を求め、あらかじめ推定した
文字ピッチから文字の分離を行なっている。
一方、文字間における文字ストロークが入り込む可能性
のある記載制限のない自由手書文字列においては、上記
射影のみから文字を分離することは困難になるので、各
連結文字の矩形座標を2次元的に計測し、推定文字ピッ
チが有する範囲内での矩形座標を統合することにより入
り込み文字の分離を行なっている。
(発明が解決しようとする課8) 従来は、読取対象としている文字は枠内に書かれた文字
、はぼ同一ピッチで印字された文字を対象としているた
め、それらの文字を文字単位に検出切出しする場合、射
影パターンを基に切出しするのが回路も簡易で一般的な
処方である。しかし、管理外の一般書状に書かれた文字
は、文字間の入り込みなどにより、単純な射影では複数
文字が一文字と判定され、文字識別の低下をまねく。
一方、入り込み文字からの文字の検出切出しには、いわ
ゆるラベリングが効果があるが、漢字のように図形が離
散しやすいものに関しては、文字をなす離散図形を統合
するのに時間を要する。
そこで、本発明は、文字の検出切出しを高速かつ正確に
行なうことができ、文字識別の向上が図れる文字読取装
置を提供することを目的とする。
[発明の構成] (課題を解決するための手段) 本発明は、上記課題を解決するために、文字列をその文
字列と垂直方向にラスタ走査しながら連結画像のラベル
番号付けをすると同時に、走査線間の白から黒への変化
点から、黒から白への変化点での矩形座標と白から黒へ
の変化時の前記連結画像のラベル番号を検出し、文字列
方向に一次元的に連続する連結画像の塊と各連結画像を
対にしたものである。
(作用) 本発明によれば、文字列方向に一次元的に連続する連結
画像の塊の矩形座標と各連結画像の矩形情報を対にする
ことにより、文字を検出切出しする場合に単独文字の場
合は塊の矩形座標を、単独文字らしからぬときは塊の矩
形座標と対になっている各連結画像を統合、分離するこ
とにより、文字の検出切出しを高速かつ正確に行なうこ
とができる。
(実施例) 以下、本発明の一実施例について図面を参照して説明す
る。
第1図において、入力される2値画像は第2図に示すよ
うな2値画像であり、Y方向を主走査にしてX方向ヘラ
スタ走査していく。第1図の2次元座標はこれらラスタ
走査時のX座標、Y座標の値である。
入力2値画像は、第3図のように検出された画像の順に
ラベル伝播部1の画素の組合わせにより新しい番号を新
ラベル生成カウンタ2により生成し、伝搬する画像のラ
ベルの統合化を連結ラベル統合部3で行ない、連結テー
ブルρに格納する。
ラベル付けは、−走査前のラベル番号を有するラインバ
ッファ4からのA、B、Cのラベル番号と】画素前のD
との組合わせにより、Pの画素が“]“のときに演算さ
れ、Pの画素にラベル番号が割り当てられる。A、B、
C,Dはラベル番号のラッチ回路であり、LA、LB、
LC,LDはA、B、C,Dの組合わせにより1つだけ
選出されるが、それらのラベル番号であり、次の走査の
ラベル付けのためにラインバッファ4に格納され、また
次の画素のラベル付けのためにDにラッチされる。新ラ
ベル生成カウンタ2は、ラベル伝播部1の組合わせによ
ってPに新しいラベル番号を付加するためのカウンタで
あり、ラベル番+3LNはLA、LB、LC,LDと同
様にラインバッファ4に格納され、Dにラッチされる。
新ラベル生成カウンタ2はカウント″1“から始まる。
一方、連結テーブルρに付随する連結画像の始点、終点
を連結テーブル(lxs、ρXe+ D y s。
ρyeに格納する。第5図にそれらの形態を示す。
また、連結テーブルpのO番地には連結画像数が格納さ
れる。一方、入力2tfi画像は個々の連結画像へのラ
ベル付け、始点、終点の検出を行なうと同時に、Xエツ
ジ検出部5において検出した白から黒への変化点WBI
の所の走査線上で最初に見つかった新ラベル生成カウン
タ2の値をエツジカウンタ6が指ず連結テーブルLに格
納する。同時に、その地点のX座標を連結テーブルLx
sに格納する。また、黒から白への変化点BWIのX座
標を連結テーブルLxeに格納する。また、連結テーブ
ルLys、Lyeは、yエツジ検出部7において検出し
たWBIからBWIの間での画像の最小座標および最大
座標がそれぞれに格納される。
エツジカウンタ6は黒から白の変化点BWIによりカウ
ントアツプされる。同様の方法により、WB2からBW
2、WB3からBW2の間のラベル番号および始点、終
点の座標が連結テーブルL。
Lxs、Lxe、Lys、Lyeにそれぞれ格納される
。最後に、エツジカウンタ6から「1」を引いた値を連
結テーブルLの0番地に格納する。
第6図にそれらの形態を示す。
以上のようにして生成された第6図で各ラベル番号に付
随する矩形座標の大きさ、文字らしき(例えば正方形に
近い)を判定する。すなわち、第4図の“認”と“識”
を構成する第6図のラベル番号「4」と「14」の矩形
座標を文字検出切出し候補とする。
しかし、第4図の“文”字”のように矩形座標が長方形
化している場合は、第6図におけるラベル番号「1」が
指す所の第5図の1番地から第6図のラベル番号「4」
の手前の「3」が指す所の第5図の3番地までの連結画
像の個数を第1図のラベル計数部8により計算し、そし
て、各連結画像の矩形座標間の判定により文字の検出切
出しを行なう。
[発明の詳細な 説明したように本発明によれば、リアルタイムに文字候
補を選出し、かつ文字連結の階層化により、離散画像か
ら構成される文字の検出切出しを高速かつ正確に行なう
ことができ、文字識別の向上が図れる文字読取装置を提
供できる。
【図面の簡単な説明】
図は本発明の一実施例を示すもので、第1図は概略的な
構成図、第2図は入力文字列を示す図、第3図は人力文
字列の連結画像のラベル付けを説明する図、第4図は文
字列方向に一次元的に連続する矩形座標を説明する図、
第5図は第3図のラベル番号と矩形座標のテーブルを示
す図、第6図は第4図のラベル番号と矩形座標のテーブ
ルを示す図である。 1・・・ラベル伝播部、2・・・新ラベル生成カウンタ
、3・・・連結ラベル統合部、4・・・ラインバッファ
、5・・・X゛エツジ検出部、6・・・エツジカウンタ
、7・・・yエツジ検出部、8・・・ラベル計数部、4
7、L・・・連結テーブル。

Claims (3)

    【特許請求の範囲】
  1. (1)複数の文字からなる文字列を各文字単位に検出切
    出しする文字読取装置において、文字列をその文字列と
    垂直方向にラスタ走査しながら連結2値画像のラベル番
    号付けをする手段と、前記走査線間での白から黒への変
    化点時の座標を検出する手段と、前記走査線間での黒か
    ら白への変化点時の座標を検出する手段と前記白から黒
    への変化点時の座標と前記黒から白への変化点時の座標
    間での文字列と垂直方向の2値画像の最小座標と最大座
    標を前記ラスタ走査時に検出する手段とにより矩形座標
    を検出する手段と、前記矩形座標と矩形座標内に存在す
    る複数のラベル付き連結画像とを対にする手段とを具備
    したことを特徴とする文字読取装置。
  2. (2)前記矩形座標の縦、横の長さおよび縦、横の比率
    から矩形座標が文字を構成するものと判定できるときは
    該矩形座標を一意に文字検出切出結果とすることを特徴
    とする請求項1記載の文字読取装置。
  3. (3)前記矩形座標が一意に文字検出切出結果と判定さ
    れないときは前記矩形座標と対をなすラベル付き連結画
    像間での分離、統合を行なうことにより文字の検出切出
    しを行なうことを特徴とする請求項1記載の文字読取装
    置。
JP1321297A 1989-12-13 1989-12-13 文字読取装置 Pending JPH03182985A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1321297A JPH03182985A (ja) 1989-12-13 1989-12-13 文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1321297A JPH03182985A (ja) 1989-12-13 1989-12-13 文字読取装置

Publications (1)

Publication Number Publication Date
JPH03182985A true JPH03182985A (ja) 1991-08-08

Family

ID=18131004

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1321297A Pending JPH03182985A (ja) 1989-12-13 1989-12-13 文字読取装置

Country Status (1)

Country Link
JP (1) JPH03182985A (ja)

Similar Documents

Publication Publication Date Title
US7170647B2 (en) Document processing apparatus and method
JP4574503B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP2001109844A (ja) 文字列抽出方法、手書き文字列抽出方法、文字列抽出装置、および画像処理装置
IL98293A (en) A method for distinguishing between text and graphics
JP3268552B2 (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
JPH03182985A (ja) 文字読取装置
JPH0564396B2 (ja)
JPH06111057A (ja) 光学的文字読取装置
JP2590099B2 (ja) 文字読取方式
JPS61289476A (ja) 文字読取装置のフオ−マツト生成方式
JPS6254380A (ja) 文字認識装置
JP2906608B2 (ja) 光学的文字読取装置
JPH10105641A (ja) 機械コード検出装置と機械コード検出方法
JPS596418B2 (ja) 文字読取方式
JP2000222577A (ja) 罫線処理方法、装置および記録媒体
JPH10507014A (ja) 2進イメージにおけるランドスケープ・スキャンの自動決定
JPS61206088A (ja) 文字読取装置
JPS6180477A (ja) 文書清書装置
JPH02187883A (ja) 文書読取装置
JPH0434655A (ja) 図面読取装置
JPH0127468B2 (ja)
JPS6292080A (ja) 文字パターン認識修正装置
JPH04223584A (ja) 光学式文字読取装置
JPH0528314A (ja) 光学的文字読取装置
JPS6045884A (ja) 文字認識装置の文字枠除去装置