JP2504373B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP2504373B2
JP2504373B2 JP5105804A JP10580493A JP2504373B2 JP 2504373 B2 JP2504373 B2 JP 2504373B2 JP 5105804 A JP5105804 A JP 5105804A JP 10580493 A JP10580493 A JP 10580493A JP 2504373 B2 JP2504373 B2 JP 2504373B2
Authority
JP
Japan
Prior art keywords
character
data
output
partial
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP5105804A
Other languages
English (en)
Other versions
JPH06318268A (ja
Inventor
佳子 上原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP5105804A priority Critical patent/JP2504373B2/ja
Publication of JPH06318268A publication Critical patent/JPH06318268A/ja
Application granted granted Critical
Publication of JP2504373B2 publication Critical patent/JP2504373B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は文字認識装置に関し、特
に紙面に記載されている文字をイメージデータとして読
み取り、読み取ったイメージデータから特定の文字であ
ることを識別し、その文字について予め与えられている
文字符号として出力する、文字認識装置に関する。
【0002】
【従来の技術】紙面などに記載されている文字群をイメ
ージデータとして読取り、一つずつの文字のイメージデ
ータとして取り出し、取り出した個々のイメージデータ
のそれぞれについて、特定の文字であることを識別し、
識別した文字に予め割り当られている文字符号を出力す
る従来のこの種の文字認識装置としては、たとえば、特
開昭63−136181号公報に記載の文字読取り装置
がある。
【0003】上述の公報記載の装置においては、走査部
によって複数の文字の記載面をスキャンして文字画像を
光電変換し、光電変換した信号をディジタルデータに変
換し、このディジタルデータを文字部分と背景部分との
二値データとした上で、投影法などにより1文字分ずつ
の方形領域である二値データとして切り出し(マス
ク)、切り出した二値データであるマスクの外縁部にノ
イズ検出領域を設けておき、このノイズ検出領域内だけ
に存在し、ノイズ検出領域内より内部の領域部分のデー
タに連続していない情報をノイズとして、上述のマスク
より除去し、このように除去したマスクのデータを予め
文字符号とこの文字符号に対応させて記憶させている文
字パターンの領域(辞書)とを比較し、最も辞書中のパ
ターンに一致する文字符号を所望の文字として識別して
出力させている。
【0004】
【発明が解決しようとする課題】上述した従来の文字認
識装置は、方形状に切り出された1字ずつの二値データ
の内で、外縁部分の限定された領域であるノイズ検出領
域に限ってノイズ部分を検出し、検出したノイズ部分を
除去した二値データについて文字を識別している。従っ
て、上述のノイズ検出領域より内側の領域内の二値デー
タについては、たとえノイズが存在していても、除去さ
れず、ノイズが混入されたままの二値データについて文
字の認識を行うために、走査部(光電スキャナ)により
読み取られた信号が、所望の認識されるべき文字以外の
文字として認識される場合を生ずるという欠点を有して
いる。
【0005】本発明の目的は、一文字ずつに切り出した
二値データについて、これを互いに直交する行と列とに
区分し、この内の1行分または1列分を消去した二値デ
ータを複数生成し、これら複数の二値データのそれぞれ
について文字認識を行い、これら複数の認識された文字
の内で確率的に最も一致度の大きな文字を選択すること
により、ノイズが混入したときにも従来よりも正しい文
字を認識する確率を大とした文字認識装置を提供するこ
とにある。
【0006】
【課題を解決するための手段】本発明の文字認識装置
は、光電変換スキャナにより対象とする文字記載面上を
光学的に走査しアナログ信号に変換出力し、前記光電ス
キャナの出力を二値データのディジタルデータに変換
し、前記二値データから1文字ずつの方形領域の二値デ
ータを文字データとして取り出し、予め複数の文字符号
のそれぞれに対応して文字パターンを記憶しているパタ
ーン記憶部のパターンと比較し前記文字データと一致す
る文字パターンに該当する文字符号を文字として識別し
て出力する文字認識装置において、外部から入力される
方向指定命令により行方向か列方向かの内の何れか一方
を指定する消去方向指定信号を出力する消去方向指定手
段と、前記文字データを複数の行と前記行に直交する複
数の列とに区分した格子分割データを生成する文字デー
タ分割回路と、前記消去方向指定信号の内容に応じて前
記格子分割データの内の1行分または1列分のデータの
内の何れか一方のデータを消去した部分消去データで消
去される行または列が互いに異なる前記部分消去データ
を順次出力する部分領域消去手段と、前記部分消去デー
タが出力されるごとに前記パターン記憶部内のパターン
と比較し前記部分消去データと一致する文字符号を出力
する文字認識手段と、前記文字データの一つについて出
力される前記複数の文字符号の度数を検出し最大の度数
を有する文字符号を文字符号として外部に出力する文字
決定部とを備えて構成されている。
【0007】また、第2の発明の文字認識装置は、光電
変換スキャナにより対象とする文字記載面上を光学的に
走査しアナログ信号に変換出力し、前記光電スキャナの
出力を二値データのディジタルデータに変換し、前記二
値データから1文字ずつの方形領域の二値データを文字
データとして取り出し、予め複数の文字符号のそれぞれ
に対応して文字パターンを記憶しているパターン記憶部
のパターンと比較し前記文字データと一致する文字パタ
ーンに該当する文字符号を文字として識別して出力する
文字認識装置において、前記文字データを複数の行と前
記行に直交する複数の列とに区分した格子分割データを
生成する文字データ分割回路と、前記格子分割データに
ついて前記行の内の互いに異る1行分を消去した複数の
データおよび前記列の内の互いに異る1列分を消去した
複数のデータとを順次部分消去データとして出力する部
分領域消去手段と、前記部分消去データが出力されるご
とに前記パターン記憶部内のパターンと比較し前記部分
消去データと一致する文字符号を出力する文字認識手段
と、前記文字データの一つについて出力される前記複数
の文字符号の度数を検出し最大の度数を有する文字符号
を文字符号として外部に出力する文字決定部とを備えて
構成されている。
【0008】
【実施例】次に、本発明の実施例について図面を参照し
て説明する。
【0009】図1は本発明の文字認識装置の一実施例を
示すブロック図である。
【0010】本実施例の文字認識装置は、図1に示すよ
うに、文字が記載されている所望の領域をスキャンし
て、文字画像を光電変換し出力する光電変換スキャナ1
と、光電変換スキャナ1の出力であるアナログ信号をデ
ィジタル信号に変換するA/D変換回路2と、このディ
ジタル信号を一時記憶する画像メモリ3と、画像メモリ
3に記憶されたディジタル信号を読み出し文字部分とそ
の背景部分との二値データに変換する二値化回路4と、
二値データ中から1文字分の方形領域ずつに順次切り出
し、文字データとして出力する文字領域検出回路5とを
備えている。
【0011】さらに、図1に示した文字認識装置は、文
字領域検出回路5が出力する文字データすなわち1文字
分の二値データをX方向(行方向)とY方向(列方向)
にそれぞれ決められた複数のピクセルずつに区分したデ
ータである格子分割データを出力する文字データ分割回
路6と、格子分割データである二値データの内で指定さ
れた方向である行か列の内の1行または1列分のデータ
を格子分割データよりり除去した部分消去データを出力
する部分領域消去回路7と、外部からの方向指定命令に
従って前述の方向を指定する消去方向指定信号を出力す
る消去方向指定回路10と、文字符号とこの文字符号に
該当する文字パターンとを対応づけて記憶しているパタ
ーン記憶部11とを備えている。
【0012】さらにこの文字認識装置は、上述の部分消
去データと前述のパターン記憶部11の内容とを比較し
最もパターン記憶部11の記憶するパターンに一致する
文字符号を出力する文字識別回路8と、文字識別回路8
が出力する文字符号の度数を検出し、1つの文字データ
に対して文字識別回路8が出力する複数の文字符号の内
で度数が最大である文字符号を選択し出力する文字決定
部9とを備えている。
【0013】図2は、紙面などに記載され図1に示した
文字認識装置の読み取りの対象となる文字と、前述の二
値データをX方向およびY方向へ投影したときの波形の
関係の一例を示す説明図である。
【0014】光電変換スキャナ1は、たとえば、読み出
すべき紙面をライン状にスキャンし照射する光源と、光
源からの反射光のレベルを検出し、このレベルに比例し
たレベルを持つ電気信号に変換してアナログ信号として
出力する変換器である。
【0015】この光電変換スキャナ1の出力は、A/D
変換回路2でディジタル信号に変換され、画像メモリ3
に一時的に記憶される。このディジタル信号の表わす個
々のディジタル値は、一つのピクセルに相当する。
【0016】このディジタル信号を二値化回路4が読み
出し、文字部分を、たとえば、論理値″1″とし、紙面
の文字の背景部分に相当するディジタル信号部分を″
0″とした二値データに変換する。
【0017】たとえば、このようにして、図2に示す文
字「A」と「B」とが図示のように隣接して二値データ
に変換されたとする。
【0018】なお、図2においては、文字「A」から
「B」に亘ってX方向にノイズNが対象画面上に存在す
るとする。
【0019】このような二値データについて、文字領域
検出回路5は投影法により1文字に相当する二値データ
を順次出力する。すなわち、文字領域検出回路5は、X
を一定とし、Yを変化させたときの該当する位置の二値
データが論理値″1″であるものを累算したものをX方
向への投影とし(図2中の曲線C)と、Yを一定とし、
Xを変化させたときの二値データ中の″1″を累算した
ものをY方向への投影(図2中の曲線D)を求める。
【0020】文字領域検出回路5は、このようなX方向
とY方向との投影について、その微分値が予め定められ
た値より大となる点でその絶対値が予め定められた値よ
り小なる点を始点とし、その微分値が別に予め定めた値
より小となりかつその絶対値が予め定めた値より小であ
る点を終点とし、始点から、この始点に隣接する終点ま
でを一つの文字領域とし、曲線CとDとについて、この
ような文字領域を一つずつ求め、たとえば、図2に示さ
れている方形の領域a1とb1とをそれぞれの文字領域
として、順次a1およびb1の領域に含まれる二値デー
タをそれぞれ1字分の文字データとして、文字データ分
割回路6に出力する。
【0021】図3は、このような1文字分の文字データ
の内で図2のa1に相当する領域の文字データを後述す
る文字データ分割回路6で区分した格子分割データの内
で、後述する部分領域消去回路が7が出力する一つの部
分消去データの内容を示す説明図である。
【0022】文字データ分割回路6は、入力された文字
データについて、図2に示すようにX方向の行L1から
行Lmまでのm個の行と、Y方向の列C1からCnまで
のn個の列とに区分した格子分割データを生成する。
【0023】たとえば、列C1と行L1とで区分される
領域Zには、二値データの持つX方向のピクセルとし
て、8個のピクセルが、また、Y方向には4個のピクセ
ルを含んでいる。
【0024】また、このような行と列とで区分される、
どの領域も上述の領域Zと同数のピクセル成分をそれぞ
れXとY方向に持っている。
【0025】今、図1に示されている消去方向指定回路
10に外部からX方向を指定する消去方向指定命令が入
力されたときには、消去方向指定回路10は部分領域消
去回路7に対して消去方向指定信号として行方向を消去
する信号を出力する。
【0026】また、上述の消去方向指定回路10に対し
て外部からY方向を指定する消去方向指定命令が入力さ
れたときには、消去方向指定回路10は列方向を消去す
る消去方向指定信号を出力する。
【0027】部分領域消去回路7は、消去方向指定回路
10からの出力が行方向を消去する消去方向指定信号で
あれば、たとえば、第1行目である行L1をすべて消去
したものを部分消去データとして文字認識回路8に出力
し、続いて、行L2の成分を格子分割データから消去し
たものを部分消去データとして出力する、このようにし
て、順次互いに異る行について行L1から行Lmまで、
1行分ずつ消去したデータを部分消去データとして、文
字認識回路8に出力する。
【0028】ここで、もし、消去方向指定回路10から
の出力が、列方向を指定さた消去方向指定信号であると
きには、部分領域消去回路7は、入力された格子分割デ
ータについて、列C1成分を消去した部分消去データか
ら、列Cn成分を消去した部分消去データまで、互いに
異る部分消去データを文字認識回路8に順次出力する。
【0029】図3に示した部分消去データは、行消去命
令が消去方向指定回路10から出力されているとき、行
L3を消去した部分消去データの内容を示している。
【0030】従って、格子分割データ中の行L3に、図
2中に示されているノイズNの成分が含まれているとす
れば、行L3を消去した部分消去データからはノイズ成
分が除去されて出力されることになる。
【0031】文字認識回路8は、上述した部分消去デー
タが入力されるごとに、パターン記憶部11に記憶され
ているパターンを参照し部分消去データに最も一致する
パターンを選択し、このパターンに関係づけて記憶され
ている文字符号を読み出し文字認識の結果として出力す
る。
【0032】ここで、パターン記憶部11が記憶してい
るパターンの大きさと、部分消去データの大きさとが同
一となるように、部分領域消去回路7で正規化も同時に
行わせる。
【0033】文字決定部9は、文字領域検出回路5が出
力する文字データの一つに対して、文字認識回路8が出
力する複数の文字符号についての度数を算出し、最大の
度数を持つ文字符号を所望の文字として選択し出力す
る。
【0034】従って、予め、認識すべき文字に含まれて
いるノイズが列方向に沿ったものが多いか、行方向に沿
ったものが多いかを調べ、たとえば、列方向に沿ったノ
イズが多いときには、列方向を指定した方向指定消去命
令を消去方向指定回路10に入力しておけば、対象とす
る文字記載面にノイズが含まれていても、そのノイズ成
分の含まれていない二値データを部分消去データの内に
含ませることができる。
【0035】図4は、本発明の文字認識装置の内で図1
とは別の実施例を示すブロック図である。
【0036】図4に示した文字認識装置は、図1中に示
されて消去方向指定回路10が省略され、図1中に示さ
れている部分領域消去回路7の代りに文字データ分割回
路6の出力を入力とし、文字認識回路8へ出力する部分
領域消去回路12を使用している点が図1に示した実施
例と異なる。
【0037】部分領域消去回路12は、文字データ分割
回路6より出力される格子分割データについて、1行分
のデータを消去したものを一つの部分消去データとし、
すべての行について特定の1行だけ消去した部分消去デ
ータ、すなわち、格子分割データが、m個の行で構成さ
れていればm種の部分消去データを一つずつ順次生成し
て出力し、続いて、上述の格子分割データについて、す
べての列について、1列分のデータを消去した部分消去
データを、生成し部分消去データとして順次出力する。
すなわち、格子分割データが図3に示すように、C1か
らCnまでn個の列を持っていれば、n個の互いに異な
る列成分をそれぞれ1列ずつ消去した部分消去データを
順次出力する。
【0038】文字認識回路8は、上述の部分消去データ
が順次入力されるごとに、個々の部分消去データについ
て、パターン記憶部11の記憶しているパターンと比較
し、最も一致するパターンに関係づけられている文字符
号を読み出し、文字決定部9に出力する。
【0039】従って、文字決定部9は、文字領域検出回
路5が出力する1文字分の文字データについて、部分領
域消去回路12が出力する複数の部分消去データであ
る、互いに異なる1行分のデータが格子分割データから
消去された複数の部分消去データと、同様に、互いに異
なる1列分のデータが格子分割データから消去された複
数個の部分消去データについて、文字認識回路8が出力
する文字符号の度数を算出し、算出した度数の内で最大
な度数を持つ文字符号を選択して文字符号として出力す
る。
【0040】
【発明の効果】以上説明したように、本発明の文字認識
装置は、1文字分の二値データを複数の行と列とに区分
し、1行分または1列分のデータを除去した複数種の互
いに異る部分消去データを生成し、そのそれぞれの部分
消去データについて文字認識を行い、最も認識度数の多
い文字符号を識別文字として出力するので、上述の部分
消去データの内には、ノイズ成分を消去したものを含む
ことになり、このようにノイズが除去された部分消去デ
ータについての文字認識を含ませることにより、従来の
この種の文字認識装置にくらべて所望の文字を確率的に
高い確度で識別することができるという効果を有してい
る。
【図面の簡単な説明】
【図1】本発明の文字認識装置の一実施例を示すブロッ
ク図である。
【図2】本発明の対象とする文字と混入されたノイズと
その投影との関係を示す説明図である。
【図3】図1に示されている部分領域消去回路7が出力
する部分消去データと格子分割データとの関係を示す説
明図である。
【図4】図1とは別の本発明の実施例を示すブロック図
である。
【符号の説明】
1 光電変換スキャナ 2 A/D変換回路 3 画像メモリ 4 二値化回路 5 文字領域検出回路 6 文字データ分割回路 7 部分領域消去回路 8 文字認識回路 9 文字決定部 10 消去方向指定回路 11 パターン記憶部 12 部分領域消去回路

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 光電変換スキャナにより対象とする文字
    記載面上を光学的に走査しアナログ信号に変換出力し、
    前記光電スキャナの出力を二値データのディジタルデー
    タに変換し、前記二値データから1文字ずつの方形領域
    の二値データを文字データとして取り出し、予め複数の
    文字符号のそれぞれに対応して文字パターンを記憶して
    いるパターン記憶部のパターンと比較し前記文字データ
    と一致する文字パターンに該当する文字符号を文字とし
    て識別して出力する文字認識装置において、外部から入
    力される方向指定命令により行方向か列方向かの内の何
    れか一方を指定する消去方向指定信号を出力する消去方
    向指定手段と、前記文字データを複数の行と前記行に直
    交する複数の列とに区分した格子分割データを生成する
    文字データ分割回路と、前記消去方向指定信号の内容に
    応じて前記格子分割データの内の1行分または1列分の
    データの内の何れか一方のデータを消去した部分消去デ
    ータで消去される行または列が互いに異なる前記部分消
    去データを順次出力する部分領域消去手段と、前記部分
    消去データが出力されるごとに前記パターン記憶部内の
    パターンと比較し前記部分消去データと一致する文字符
    号を出力する文字認識手段と、前記文字データの一つに
    ついて出力される前記複数の文字符号の度数を検出し最
    大の度数を有する文字符号を文字符号として外部に出力
    する文字決定部とを備えることを特徴とする文字認識装
    置。
  2. 【請求項2】 光電変換スキャナにより対象とする文字
    記載面上を光学的に走査しアナログ信号に変換出力し、
    前記光電スキャナの出力を二値データのディジタルデー
    タに変換し、前記二値データから1文字ずつの方形領域
    の二値データを文字データとして取り出し、予め複数の
    文字符号のそれぞれに対応して文字パターンを記憶して
    いるパターン記憶部のパターンと比較し前記文字データ
    と一致する文字パターンに該当する文字符号を文字とし
    て識別して出力する文字認識装置において、前記文字デ
    ータを複数の行と前記行に直交する複数の列とに区分し
    た格子分割データを生成する文字データ分割回路と、前
    記格子分割データについて前記行の内の互いに異る1行
    分を消去した複数のデータおよび前記列の内の互いに異
    る1列分を消去した複数のデータとを順次部分消去デー
    タとして出力する部分領域消去手段と、前記部分消去デ
    ータが出力されるごとに前記パターン記憶部内のパター
    ンと比較し前記部分消去データと一致する文字符号を出
    力する文字認識手段と、前記文字データの一つについて
    出力される前記複数の文字符号の度数を検出し最大の度
    数を有する文字符号を文字符号として外部に出力する文
    字決定部とを備えることを特徴とする文字認識装置。
JP5105804A 1993-05-07 1993-05-07 文字認識装置 Expired - Lifetime JP2504373B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5105804A JP2504373B2 (ja) 1993-05-07 1993-05-07 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5105804A JP2504373B2 (ja) 1993-05-07 1993-05-07 文字認識装置

Publications (2)

Publication Number Publication Date
JPH06318268A JPH06318268A (ja) 1994-11-15
JP2504373B2 true JP2504373B2 (ja) 1996-06-05

Family

ID=14417306

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5105804A Expired - Lifetime JP2504373B2 (ja) 1993-05-07 1993-05-07 文字認識装置

Country Status (1)

Country Link
JP (1) JP2504373B2 (ja)

Also Published As

Publication number Publication date
JPH06318268A (ja) 1994-11-15

Similar Documents

Publication Publication Date Title
US5616905A (en) Two-dimensional code recognition method
US4873426A (en) Technique for reading bar codes
EP0372762B1 (en) Minutia data extraction in fingerprint identification
US5048107A (en) Table region identification method
US7454060B2 (en) Image processor for character recognition
US5280544A (en) Optical character reading apparatus and method
US5377280A (en) Method and apparatus for automatic language determination of European script documents
US6364209B1 (en) Data reading apparatus
JPS59125476A (ja) イメ−ジ・フイ−ルドのカツト処理装置
US5195147A (en) Image forming apparatus
JP3887843B2 (ja) ディジタル化画像の縦横ラインを検知し修正する方法および装置
JP2504373B2 (ja) 文字認識装置
EP0651337A1 (en) Object recognizing method, its apparatus, and image processing method and its apparatus
JP2812619B2 (ja) 画像処理装置
JPS62121589A (ja) 文字切出し方法
JP2902097B2 (ja) 情報処理装置及び文字認識装置
JP3095437B2 (ja) 文字行検出切出装置および文字読取装置
JP3358133B2 (ja) 画像処理装置
JPS6160475B2 (ja)
JPS6343788B2 (ja)
JPH0721303A (ja) 文字認識装置
JPH07120392B2 (ja) 文字パターン切り出し装置
JPS596419B2 (ja) 文字切出し方式
JPH10233930A (ja) 画像処理装置
JP2683711B2 (ja) 文字・記号データの認識・修正方法

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19960213