JPH04260181A - 文字読取装置 - Google Patents

文字読取装置

Info

Publication number
JPH04260181A
JPH04260181A JP3022256A JP2225691A JPH04260181A JP H04260181 A JPH04260181 A JP H04260181A JP 3022256 A JP3022256 A JP 3022256A JP 2225691 A JP2225691 A JP 2225691A JP H04260181 A JPH04260181 A JP H04260181A
Authority
JP
Japan
Prior art keywords
character
density value
value data
data
detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3022256A
Other languages
English (en)
Inventor
Masato Suda
正人 須田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP3022256A priority Critical patent/JPH04260181A/ja
Publication of JPH04260181A publication Critical patent/JPH04260181A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、記録媒体上の文字を光
学的に読取る文字読取装置に係り、特に入力される文字
画像から各文字単位の検出切出しを行なう文字の検出切
出し技術に関する。
【0002】
【従来の技術】この種の文字読取装置にあっては、一般
に入力される文字画像が白系統の背景上に黒系統で記載
されているため、A/D変換された多値画像があるしき
い値よりも濃度が低い場合は文字、濃度が高い場合は背
景と規定して2値化し、文字の検出切出しを行ない、文
字を認識している。
【0003】一方、入力される文字画像が白系統の背景
上に黒系統で記載されているものや、黒系統の背景上に
白系統で記載されているものを、同一方式で検出切出し
を行ない、認識する場合は、入力時の事前情報からA/
D変換後の多値画像または2値画像を白黒反転処理し、
その後、文字の検出切出しを行ない、文字の認識を行な
っている。
【0004】
【発明が解決しようとする課題】ところが、入力される
文字画像が白系統の背景上に黒系統で記載されているも
のか、黒系統の背景上に白系統で記載されているものか
の事前情報は、利用者がマニュアルで設定を行なうため
、両者の切換時ごとに設定するのは煩わしいという問題
があった。また、両者が混在して入力されると、一方の
処理は通常の認識処理を行なうが、もう一方は誤読とし
て処理されることもあり、装置の認識性能を低下させる
という問題があった。
【0005】そこで、本発明は、文字画像が白系統の背
景上に黒系統で記載されているものと、黒系統の背景上
に白系統で記載されているものが混在して入力されても
、同一の方式で常に安定した文字の検出切出しを行なう
ことができ、しかも、比較的簡単な構成でそれが実現で
きる文字読取装置を提供することを目的とする。
【0006】
【課題を解決するための手段】本発明の文字読取装置は
、入力される多値の文字画像に対して繰返し走査するこ
とにより、その1走査線ごとに最大濃度値データを抽出
する最大濃度値抽出手段と、前記入力される多値の文字
画像に対して繰返し走査することにより、その1走査線
ごとに最小濃度値データを抽出する最小濃度値抽出手段
と、前記抽出された最大濃度値データと最小濃度値デー
タとの間で所定の演算を行なうことにより濃度差データ
を求める演算手段と、この演算手段で求めた濃度差デー
タにより文字を検出し切出す文字検出切出手段と、この
文字検出切出手段で切出された文字を認識する文字認識
手段とを具備している。
【0007】
【作用】文字の濃度が白系統で背景の濃度が黒系統の場
合は、最大濃度値データは文字を走査した部分は高い値
となり、背景のみ走査した部分は低い値となり、最小濃
度値データは文字の部分も背景の部分も低い値となる。 そのため、最大濃度値データから最小濃度値データを引
算すると、文字の部分のみが高い値として検出される。 一方、文字の濃度が黒系統で背景の濃度が白系統の場合
は、最大濃度値データは文字の部分、背景の部分ともに
高い値となり、最小濃度値データは文字を走査した部分
は低い値となり、背景を走査した部分は高い値となる。 そのため、最大濃度値データから最小濃度値データを引
算すると、疑似的に最小濃度値データを反転したものと
なる。したがって、背景と文字との濃度の関係が白系統
に黒系統、黒系統に白系統のどちらであっても、ラスタ
走査ごとの最大濃度値データと最小濃度値データをそれ
ぞれ求め、最大濃度値データから最小濃度値データを引
算し、その濃度差データにより文字の検出切出しを行な
うことにより、同一方式による文字の検出切り出しが可
能となる。
【0008】
【実施例】以下、本発明の一実施例について図面を参照
して説明する。
【0009】図1において、光電変換部1は、たとえば
文字等が記録された記録媒体上に光を照射する光源と、
記録媒体上からの反射光を受光し、電気信号に変換する
CCD形センサなどの光電変換器と、光源からの光を記
録媒体上に導き、その反射光を光電変換器に導く光学系
などからなり、記録媒体上を光走査することにより電気
信号(アナログ信号)に変換するようになっている。光
電変換部1からのアナログ信号は、A/D変換部2にお
いて多値のデジタル信号に変換され、文字画像として多
値画像メモリ3に格納される。
【0010】多値画像メモリ3に格納された文字画像は
、最大濃度値データ格納部4において、文字記載方向(
文字列方向)あるいは、それと垂直方向にラスタ走査さ
れることにより、各走査線上での最大濃度値データが抽
出され、格納される。また、多値画像メモリ3に格納さ
れた文字画像は、最小濃度値データ格納部5において、
文字記載方向あるいは、それと垂直方向にラスタ走査さ
れることにより、各走査線上での最小濃度値データが抽
出され、格納される。
【0011】こうして、最大濃度値データ格納部4に格
納された最大濃度値データおよび最小濃度値データ格納
部5に格納された最小濃度値データは、それぞれ引算器
6に送られる。引算器6は、最大濃度値データから最小
濃度値データを引算して、その濃度差データを求め、濃
度差データ格納部7に格納する。そして、文字検出切出
部8において、濃度差データ格納部7に格納された濃度
差データを用いて各文字単位の検出切出しが行なわれ、
その後、文字認識部9で辞書との類似度計算を行なうこ
とにより、各文字の認識処理が行なわれる。
【0012】図2および図3は、上述した処理の一例を
図示したものである。図2における画像10は、文字画
像が背景画像よりも濃度値が高い場合である。多値画像
メモリ3に格納された文字画像は、初めに、文字記載方
向にラスタ走査され、各走査線上での最大濃度値データ
11および最小濃度値データ12が抽出される。最大濃
度値データ11から最小濃度値データ12を引算すると
、濃度差データ13が得られ、この濃度差データ13か
ら文字列の高さが検出される。次に、検出された文字列
内を文字記載方向と垂直方向にラスタ走査することによ
り、最大濃度値データ14および最小濃度値データ15
を抽出する。最大濃度値データ14から最小濃度値デー
タ15を引算すると、濃度差データ16が得られる。 こうして得られた濃度差データ13,16を射影情報と
して用いることにより、文字の検出切出しが行なわれる
【0013】一方、図3における画像20は、文字画像
が背景画像よりも濃度値が低い場合である。多値画像メ
モリ3に格納された文字画像は、初めに、文字記載方向
にラスタ走査され、各走査線上での最大濃度値データ2
1および最小濃度値データ22が抽出される。最大濃度
値データ21から最小濃度値データ22を引算すると、
濃度差データ23が得られ、この濃度差データ23から
文字列の高さが検出される。次に、検出された文字列内
を文字記載方向と垂直方向にラスタ走査することにより
、最大濃度値データ24および最小濃度値データ25を
抽出する。最大濃度値データ24から最小濃度値データ
25を引算すると、濃度差データ26が得られる。こう
して得られた濃度差データ23,26を射影情報として
用いることにより、文字の検出切出しが行なわれる。
【0014】なお、前記実施例では、全画像領域で処理
を行なったが、分割した領域ごとの最大濃度値データお
よび最小濃度値データを抽出し、各分割単位での処理を
統合して文字の検出切出しを行なうことも可能である。
【0015】
【発明の効果】以上詳述したように本発明によれば、文
字画像の最大濃度値データと最小濃度値データとの差デ
ータを用いて文字の検出切出しを行なうことにより、文
字画像が白系統の背景上に黒系統で記載されているもの
と、黒系統の背景上に白系統で記載されているものが混
在して入力されても、同一の方式で常に安定した文字の
検出切出しを行なうことができ、しかも、比較的簡単な
構成でそれが実現できる文字読取装置を提供できる。
【図面の簡単な説明】
【図1】本発明の一実施例に係る文字読取装置の構成を
示すブロック図。
【図2】同実施例が対象とする文字画像が背景画像より
も濃度値が高い場合の文字画像とその処理例を示す図。
【図3】同実施例が対象とする文字画像が背景画像より
も濃度値が低い場合の文字画像とその処理例を示す図。
【符号の説明】
1……光電変換部、2……A/D変換部、3……多値画
像メモリ、4……最大濃度値データ格納部、5……最小
濃度値データ格納部、6……引算器、8……文字検出切
出部、9……文字認識部。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】  入力される多値の文字画像に対して繰
    返し走査することにより、その1走査線ごとに最大濃度
    値データを抽出する最大濃度値抽出手段と、前記入力さ
    れる多値の文字画像に対して繰返し走査することにより
    、その1走査線ごとに最小濃度値データを抽出する最小
    濃度値抽出手段と、前記抽出された最大濃度値データと
    最小濃度値データとの間で所定の演算を行なうことによ
    り濃度差データを求める演算手段と、この演算手段で求
    めた濃度差データにより文字を検出し切出す文字検出切
    出手段と、この文字検出切出手段で切出された文字を認
    識する文字認識手段とを具備したことを特徴とする文字
    読取装置。
JP3022256A 1991-02-15 1991-02-15 文字読取装置 Pending JPH04260181A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3022256A JPH04260181A (ja) 1991-02-15 1991-02-15 文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3022256A JPH04260181A (ja) 1991-02-15 1991-02-15 文字読取装置

Publications (1)

Publication Number Publication Date
JPH04260181A true JPH04260181A (ja) 1992-09-16

Family

ID=12077698

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3022256A Pending JPH04260181A (ja) 1991-02-15 1991-02-15 文字読取装置

Country Status (1)

Country Link
JP (1) JPH04260181A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014130415A (ja) * 2012-12-28 2014-07-10 Nidec Sankyo Corp 文字認識装置、文字認識方法、及び文字認識プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014130415A (ja) * 2012-12-28 2014-07-10 Nidec Sankyo Corp 文字認識装置、文字認識方法、及び文字認識プログラム

Similar Documents

Publication Publication Date Title
US4757551A (en) Character recognition method and system capable of recognizing slant characters
JP2940936B2 (ja) 表領域識別方法
JPH0546591B2 (ja)
JP2000207489A (ja) 文字抽出方法、装置および記録媒体
EP0505729B1 (en) Image binarization system
JPH04260181A (ja) 文字読取装置
JPH0548510B2 (ja)
JPH0291789A (ja) 文字認識方法
EP0504576A2 (en) Document scanner
JP3095437B2 (ja) 文字行検出切出装置および文字読取装置
JPH10108012A (ja) 像域分離装置
JPH08237404A (ja) 光学文字認識モードの選択方法
JP2894111B2 (ja) 光学式活字文字認識装置における認識結果の総合判定方式
JPH0119193B2 (ja)
JPH07230525A (ja) 罫線認識方法及び表処理方法
JPH04167084A (ja) 文字読取装置
JPH04294475A (ja) 文字読取装置
JP2853140B2 (ja) 画像領域識別装置
JP3020293B2 (ja) 属性判別方法
JP2002015283A (ja) 分離文字列統合方法および装置
JP2023034823A (ja) 画像処理装置、画像処理装置の制御方法およびプログラム
JPH02166583A (ja) 文字認識装置
JPH08315140A (ja) 画像処理装置およびその方法
JPS61290581A (ja) 検索情報抽出記憶装置
JPH05298482A (ja) 文字読取装置