JPH02253386A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH02253386A
JPH02253386A JP1074575A JP7457589A JPH02253386A JP H02253386 A JPH02253386 A JP H02253386A JP 1074575 A JP1074575 A JP 1074575A JP 7457589 A JP7457589 A JP 7457589A JP H02253386 A JPH02253386 A JP H02253386A
Authority
JP
Japan
Prior art keywords
character
dot
data
image
run length
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1074575A
Other languages
English (en)
Inventor
Minoru Nagao
永尾 実
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Tateisi Electronics Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Tateisi Electronics Co filed Critical Omron Tateisi Electronics Co
Priority to JP1074575A priority Critical patent/JPH02253386A/ja
Publication of JPH02253386A publication Critical patent/JPH02253386A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (発明の分野) この発明は、光学的手段により撮像された文字画像から
文字特徴を抽出し、文字認識をする文字認識装置に関し
、より詳しくは、ドツト文字についても認識可能にした
文字認識装置に関する。
(発明の概要) この発明は、文字認識装置に入力された画像中にドツト
文字が含まれる場合、X、 Y方向それぞれに作成され
たヒストグラム中に発生するドツト文字特有の画像がと
ぎれる部分を連続した画像として補完することにより、
通常文字と同様に1文字ごとに切り出して認識できるよ
うにしたものである。
(従来技術とその問題点) 従来の文字認識装置は、第5図に示すように構成されて
おり、撮像手段であるカメラ1が対象物9を撮像して得
られた文字画像は、A/D変換器2でA/D変換され、
さらに2値化回路3で2値化され、画像メモリ4に格納
される。
次に文字切り出し部11が画像メモリ4に格納された文
字画像から1文字ごとの画像データを切り出し、さらに
特徴抽出部12が、切り出された画像データから文字特
徴を抽出し、その文字特徴と辞書部7に格納されている
文字毎の標準パターン(標準特徴列)とが辞書照合部1
3で照合され、その結果が認識結果として文字コード(
ASCI■コード等)により出力される。
上記の文字切り出し部11における文字切り出し手順は
、第6図のように行われる。
図に示すように2値化された画像メモリ4に格納された
文字データをX、7両方向について黒字(文字部)のヒ
ストグラムを取りそれぞれのヒストグラムのAND領域
に1文字分が存在するものとして、AND領域が成立す
る領域を1文字ずつ取り出しく切り出し)順次認識する
ようにしていた。
ところが、認識対象がドツト構成の不連続文字の場合は
第7図に示すような不具合がある。
すなわち、X、7両方向のヒストグラムからAND領域
を抜き出すと、各ドツト画像ごとに抜き出されてしまい
、1文字単位での切り出しができず、ドツト文字の全体
を認識することが不可能であった。
(発明の目的) この発明は、上記の問題を解消するためになされたもの
であり、その目的とするところはドツト文字の認識を可
能にした文字認識装置を提供することにある。
(発明の構成と効果) この発明は上記目的を達成するために、カメラ等の画像
入力手段と、入力された画像を記憶する画像記憶手段と
、文字ごとの標準パターンを記憶した辞書記憶手段と、
上記画像記憶手段に記憶された画像データの認識対象と
なる領域から1文字分の画像データを切り出す1文字切
り出し手段と、切り出された1文字分の画像データから
文字の特徴を抽出する特徴抽出手段と、抽出された特徴
と上記辞書記憶手段内の標準パターンの特徴とを照合し
て文字の判定を行なう照合判定手段とを具備する文字認
識装置において、 認識対象領域のビットマツプからX、 Y方向それぞれ
に画素値のヒストグラムを作成するヒストグラム作成手
段と、 作成されたヒストグラムからX、 Y方向にそれぞれの
ランレングスを算出するランレングス算出手段と、 得られたランレングスデータをX、Y方向それぞれに走
査し、予め設定しておいたノイズレベルよりも小さいラ
ンクレスデータを除去補正するノイズ除去手段と、 ノイズが除去されたランレングスデータをX。
Y方向それぞれに走査し、予め設定しておいたドツト文
字のドツト間隔よりも小さい、画像なしを表わす画素の
ランレングスデータを、画像が連続したランレングスデ
ータに補正するドツト間隔補完手段と、 を上記1文字切り出し手段に具備することにより、認識
対象領域内に含まれるドツト文字を切り出し可能にした
ことを特徴とする。
この発明によればζ文字認識装置に入力された画像中に
ドツト文字が含まれる場合、X、Y方向それぞれに作成
されたヒストグラム中に発生する、ドツト文字特有の画
像がとぎれる部分を連続した画像として補完することに
より、通常文字と同様に1文字ごとに切り出すことが可
能となり、その結果、他の通常文字と同様に文字認識が
可能になる効果が得られる。
(実施例) 以下、この発明の実施例を図面に基づいて説明する。
第1図は、この発明が適用される文字認識装置の電気的
構成を示すブロック図である。
図において、撮像手段であるカメラ1は、ドツト文字を
有する対象物9を撮像した画像信号をA/D変換器2へ
送る。
A/D変換器2は、入力された画像信号をA/D変換し
、2値化回路3へ送る。
2値化回路3は、A/D変換された画像信号を所定のレ
ベルで白、黒いずれかに2値化する。
CPU5は、2値化回路3で2値化された画像信号を画
像メモリ4へ順次、格納する以外に、文字切り出し、特
徴抽出、辞書との照合判定等の処理を行なう。
メモリ6はROM、RAM等からなり、CPU5の動作
プログラムが格納されている以外に処理中のワーキング
エリア等に使用される。
辞書部7は、文字ごとの標準パターン(標準特徴列)が
格納されており、文字を認識処理する際に用いられる。
次にこの発明の特徴であるドツト文字の切り出し処理に
ついて、第2図、第3図により説明する。
最初に画像メモリ4に格納された画像データから第2図
に示すように文字認識該当領域についてX、 Yそれぞ
れの方向の黒画素のヒストグラムを求める。ここで文字
色が白字の場合は当然ながら白画素のヒストグラムを求
める。なお文字部が黒字かあるいは白字かは予め別の手
段により設定されているものとする。
ヒストグラムのデータは、−旦、RAM等の記憶手段に
格納しておいた後、ヒストグラムデータX、Yそれぞれ
について第3図に示すようにランレングスを求める。
ここでのランレングスとは、ヒストグラムデータのある
設定数以上の黒画素について、X、 Y方向それぞれの
ランレングスを求めることである。
なお、第2図、第3図に示したY方向ヒストグラムおよ
びY方向ランレングスデータは、1文字だけの場合の例
についてを示したものである。
次に、Y方向の文字高さをY方向ランレングスを使用し
て求める方法を具体的に説明する。
まず、Y方向ランレングスデータを最初の位置(座標の
小さい方)からメモリをサーチし、最初の黒画素を見つ
ける(X、 Y方向各ランレングスデータのビット7は
白字、黒字を表示し、白字−〇、黒字=1とする)。
ここで最初に見付つけた黒画素の数が設定数k(例えば
2)以上であれば文字有りとし、k未満ならば次のY方
向ランレングスを走査し、k以上の黒が見つかるまで走
査する。k以上の黒が見つかると、その位置のY座標を
Yoとし記憶する。
続いて、次の白画素を判定し、この値が設定数m(例え
ば3)以上ならば1つ前の黒ランレングスを1文字分領
域の最下位であるものと判断し、このY座標をY、とし
て記憶する。また、白画素の値がm以上になる前に操作
が終了した場合は、前記と同様に最後の黒画素のY座標
をYlとする。
以上の走査処理により文字の高さを示すY座標が求めら
れる。
次に同様の方法でX方向のランレングスを走査し、Xo
、X、を求める。なおこのときの前記設定数mに対応し
てX方向についても設定数が設定されている。
以上のY方向、X方向それぞれのランレングス走査処理
により第4図に示すように1文字分の画像データの開始
位置(xo、yo)と終了位置(X、、Y、)が求めら
れ、1文字分の切り出しが可能となる。
以後、切り出された画像データについての特徴が抽出さ
れて辞書部7の標準パターンと照合され、文字認識がな
される。
以上のようにこの文字認識装置では、画像データの認識
対象領域について作成されたヒストグラムからランレン
グスデータを算出することにより、ドツト文字を通常の
文字と同様に1文字ごとに切り出すことが可能になる。
【図面の簡単な説明】
第1図はこの発明に係る文字認識装置の電気的構成を示
すブロック図、第2図は抽出されたヒストグラムを示す
図、第3図はランレングスデータを示す説明図、第4図
は抽出された1文字分の画像データと座標位置を示す図
、第5図は従来例を示すブロック図、第6図、第7図は
従来例の切出し手順説明図である。 1・・・カメラ 2・・・A/D変換器 3・・・2値化回路 4・・・画像メモリ 5・・・CPU 6・・・メモリ 7・・・辞書部

Claims (1)

  1. 【特許請求の範囲】 1、カメラ等の画像入力手段と、入力された画像を記憶
    する画像記憶手段と、文字ごとの標準パターンを記憶し
    た辞書記憶手段と、上記画像記憶手段に記憶された画像
    データの認識対象となる領域から1文字分の画像データ
    を切り出す1文字切り出し手段と、切り出された1文字
    分の画像データから文字の特徴を抽出する特徴抽出手段
    と、抽出された特徴と上記辞書記憶手段内の標準パター
    ンの特徴とを照合して文字の判定を行なう照合判定手段
    とを具備する文字認識装置において、認識対象領域のビ
    ットマップからX、Y方向それぞれに画素値のヒストグ
    ラムを作成するヒストグラム作成手段と、 作成されたヒストグラムからX、Y方向にそれぞれのラ
    ンレングスを算出するランレングス算出手段と、 得られたランレングスデータをX、Y方向それぞれに走
    査し、予め設定しておいたノイズレベルよりも小さいラ
    ンクレスデータを除去補正するノイズ除去手段と、 ノイズが除去されたランレングスデータをX、Y方向そ
    れぞれに走査し、予め設定しておいたドット文字のドッ
    ト間隔よりも小さい、画像なしを表わす画素のランレン
    グスデータを、画像が連続したランレングスデータに補
    正するドット間隔補完手段と、 を上記1文字切り出し手段に具備することにより、認識
    対象領域内に含まれるドット文字を切り出し可能にした
    ことを特徴とする文字認識装置。
JP1074575A 1989-03-27 1989-03-27 文字認識装置 Pending JPH02253386A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1074575A JPH02253386A (ja) 1989-03-27 1989-03-27 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1074575A JPH02253386A (ja) 1989-03-27 1989-03-27 文字認識装置

Publications (1)

Publication Number Publication Date
JPH02253386A true JPH02253386A (ja) 1990-10-12

Family

ID=13551125

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1074575A Pending JPH02253386A (ja) 1989-03-27 1989-03-27 文字認識装置

Country Status (1)

Country Link
JP (1) JPH02253386A (ja)

Similar Documents

Publication Publication Date Title
US4757551A (en) Character recognition method and system capable of recognizing slant characters
US5075895A (en) Method and apparatus for recognizing table area formed in binary image of document
US6188790B1 (en) Method and apparatus for pre-recognition character processing
JP2000207489A (ja) 文字抽出方法、装置および記録媒体
JPH09311905A (ja) 行検出方法および文字認識装置
JPH1125222A (ja) 文字切り出し方法及び文字切り出し装置
JPH02253386A (ja) 文字認識装置
JPH08123901A (ja) 文字抽出装置及び該装置を用いた文字認識装置
JP2851089B2 (ja) 表処理方法
JP3140079B2 (ja) 罫線認識方法及び表処理方法
JP2851087B2 (ja) 表処理方法
JP2800192B2 (ja) 高速文字図形分離装置
JP2803735B2 (ja) 罫線を含んだ文字認識装置
JP3566738B2 (ja) 網掛け領域処理方法および網掛け領域処理装置
JP2023034823A (ja) 画像処理装置、画像処理装置の制御方法およびプログラム
JPH0540848A (ja) 文書画像の領域抽出方法
JP4439054B2 (ja) 文字認識装置及び文字枠線の検出方法
JP3162414B2 (ja) 罫線認識方法及び表処理方法
JPH06215181A (ja) 文字・文字列切り出し方法および文字認識装置
JPH02166583A (ja) 文字認識装置
KR910005390B1 (ko) 자동문서처리 및 영문자 인식방법
JP3100619B2 (ja) 写真領域抽出装置
JPH01124082A (ja) 文字認識装置
JPH06274689A (ja) 文字認識装置
JPH0962782A (ja) 文書読取装置