JPH03252892A - 光学式文字読取装置 - Google Patents

光学式文字読取装置

Info

Publication number
JPH03252892A
JPH03252892A JP2051239A JP5123990A JPH03252892A JP H03252892 A JPH03252892 A JP H03252892A JP 2051239 A JP2051239 A JP 2051239A JP 5123990 A JP5123990 A JP 5123990A JP H03252892 A JPH03252892 A JP H03252892A
Authority
JP
Japan
Prior art keywords
character
area
projection data
width
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2051239A
Other languages
English (en)
Inventor
Yoshimi Yamada
義美 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2051239A priority Critical patent/JPH03252892A/ja
Publication of JPH03252892A publication Critical patent/JPH03252892A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、原稿に記載された文字を光学的に読取って認
識する機能を持つ光学式文字読取装置に関し、詳細には
、光学的に読取られた文字の行切り出しに関するもので
ある。
〔従来の技術〕
光学式文字読取装置(OCR)においては、原稿に記載
された文字を光学的に読取ってアナログ電気信号に変換
し、この信号をOと1に2値化して(文字部分を1、背
景部分をOとする)パターンメモリに2値パターンとし
て格納し、この2値パターンを認識回路により認識する
。そして、この認識前に、パターンメモリに格納された
2値パターンに基づいて、原稿に記載された文字の行の
切り出し処理を行っている。
第2図(a)、(b)は従来の行切り出し処理の内容を
説明するための説明図である。従来の行切り出し処理に
おいては、例えば、同図(a)の左側に示されるような
アルファベットの2値パターンを水平方向に投影し、こ
のときの黒点数の分布を調べる。そして、黒点数がO又
は予め決められたしきい値以下となるスペース領域を行
間とみなし、第2図(a)の右側に示される範囲L1〜
L2 、 L3〜L4.L5〜L6を文字領域(1行ン
とみなしていた。
〔発明が解決しようとする課題〕
しかしながら、上記従来の処理では、第2図(b)に示
される“jump t ng”のように、単語が“i”
や“j”の“・”を有する文字を含み、他の文字に“d
″や1′等のように背の高い文字を含まない場合に、水
平方向にとった投影において“・”が分離して投影(範
囲L7〜La)されてしまう。そして、このため範囲L
8〜L9を行間とみなして、誤った行切り出しがなされ
るという問題があった。
そこで、本発明は上記したような従来技術の課題を解決
するためになされたものであり、その目的とするところ
は、行切り出し性能に優れた光学式文字読取装置を提供
することにある。
〔課題を解決するための手段〕
本発明に係る光学式文字読取装置は、原稿に記載された
文字を光学的に読取りアナログ電気信号に変換する読取
手段と、このアナログ電気信号を2値パターンに変換す
る2値化手段と、この変換された2値パターンを格納す
るパターンメモリと、この格納された2値パターンから
読取った文字を認識する認識手段とを有する光学式文字
読取装置において、上記パターンメモリに格納された2
値パターンを原稿における文字の配列方向に加算して2
値パターンの投影データをとる投影手段と、予め決めら
れた枠内に、投影データの値が所定値より大きい文字領
域が、投影データの値が所定値以下となるスペース領域
を挾んで複数ある場合に、上記文字領域の幅と上記スペ
ース領域の幅とに基づいた判定により行切り出しを行う
判定手段とを有することを特徴としている。
〔作 用〕
本発明においては、パターンメモリに格納された2値パ
ターンを投影手段により原稿の文字の配列方向に加算す
ることで、2値パターンのいわゆる投影データ(例えば
、横に並ぶアルファベットの場合には水平方向の投影デ
ータ)の分布をとる。
そして、判定手段は、予め決められた枠内に、投影デー
タの値が所定値より大きい文字領域が、投影データの値
が所定値以下となるスペース領域を挾んで複数ある場合
(例えば、アルファベットの“i”のように下側の縦線
部分と上側の点部分の2つの文字領域を有する場合)に
、文字領域の幅とスペース領域の幅とに基づいた判定に
より行切り出しを行う。従って、文字領域が複数存在し
ても、直ちにそれぞれを行とみなすのではなく、文字領
域が小さ過ぎたり、又は、文字領域同士が離れ過ぎたり
した場合等に、それが汚れか、文字の一部(例えば、“
i″の上側の点部分)かを判定する。
〔実施例〕
以下に本発明を図示の実施例に基づいて説明する。
第1図は本発明に係る光学式文字読取装置の一実施例を
示すブロック図である。
同図において、1は原稿Pの文字にランプ1aにより光
を照射し光電変換素子1bにより文字を読取る読取手段
としての光学的読取部である。また、2はアナログ/デ
ジタル変換器、3はイメージメモリ、4は2値化回路で
あり、これらによりアナログ電気信号を2値データに変
換する2値化手段5を構成している。さらに、6はパタ
ーンメモリ、7は投影手段としての水平方向投影部、8
は判定手段としての行切り出し判定部、9は認識手段と
しての文字認識部である。
本実施例において、原稿Pに印刷された英単語を読取る
場合には、原稿Pの英単語を光学的読取部1で読取りア
ナログ電気信号に変換する。このアナログ画像信号はア
ナログ/デジタル変換器2によって多値デジタル信号に
変換されてイメージメモリ3に格納される。イメージメ
モリ3に格納された多値デジタル信号の画像パターンは
2値化回路4によって2値パターンに変換され、パター
ンメモリ6に格納され、文字認識部9により認識される
ところで、本実施例においては、文字認識部9により認
識がなされる前に水平方向投影部7によりパターンメモ
リ6に格納された英単語の画像パターンを水平方向に投
影して投影データを得て、この投影データから行切り出
し判定部8により行切り出しがなされる。ここで、第3
図は英単語“jumping”を読取った場合にパター
ンメモリ6に格納される2値パターンを説明するための
説明図、第4図は第3図の2値パターンを水平方向に投
影して得られた投影データを示す説明図である。以下に
、第1図、第3図、及び第4図に基づいて本実施例の行
切り出し処理を説明する。
先ず、パターンメモリ6に格納されたパターン(第3図
の“jumping”)を水平方向投影部7により水平
方向に投影して第4図に示される投影データの分布(黒
点数の分布)を得る。ここで第4図のLll” 1□”
 13” 14はそれぞれ第3図のLll”12”13
”14に対応するものとし、Fは一定の大きさの読取り
枠を示す。
次に、行切り出し判定部8は、第4図の黒点数の分布に
おいて、黒点数が予め決められたしきい値以下となる部
分(0を含む)(第4図のLllより上の領域、L12
〜L13、L14より下の領域)を検出する。そして、
行切り出し判定部8は、黒点数がしきい値を越える文字
領域L11〜L12、L13〜L14を切り出し、この
切り出され文字領域の幅W 、幅W 、及び文字領域L
11〜L12とし13〜2 L の間のスペース領域L12〜L13の幅W3に基4 づいて行切り出しを行う。
具体的には、先ず、読取られる活字の大きさに基づいて
予め決められた標準行@W、を用いて、幅W 又はW2
がαWs (αは定数、例えば、α=0.5)以上であ
るか否かを判定する。ここで、幅W スはW2がαW8
以上である場合には各文宰領域は行として扱われる。ま
た、幅W1又はW2がαW、に満たない場合には、その
文字領域はアルファベットのi″やj″における“・”
のように、アルファベットの一部である可能性があると
考えられるため、さらに以下の判定を行う。
即ち、W1≧αW3、W2くαW、である場合には、幅
W2の文字領域L11〜・L1□が“i”や“j”の“
・”かあるいは汚れかを判定する。
この場合、判定の対象となる領tIAL11〜L1□の
幅W2が、領域L13〜L14の幅W1と所定の定数β
1.とに基づいた値(W1*β1)より小さく、且つ、
スペース領域の幅W3が幅W1と所定の定数β2とに基
づいた値(W1ネβ2)より小さいか否かを判定する。
即ち、 W2 <Wl *β1          ・・・式1
W3くW1*β2          ・・・式2であ
るか否かを判定する7ここで、例えば、β1=0.5.
β2=0.4とする。
そして、式1と2の要件を満たさない場合には、領域L
11〜L1□は大き過ぎるか、又は、領域L13〜L1
4から離れ過ぎいるので、領域L11〜L12は文字の
一部ではなく原稿の汚れ等とみなす、一方、式1と2の
要件を満たす場合には、領域L11〜L12を文字領域
の一部とみなし、領域L11〜L14を1行と判定して
切り出し、文字認識部9に切り出されたパターンを出力
する。
以上のように、本実施例においては、パターンメモリ6
に格納された2値パターンを文字の配列方向に加算して
投影データの分布をとり、予め決められた枠内に文字領
域がスペース領域を挾んで複数ある場合に、文字領域の
幅とスペース領域の幅とに基づいた判定により行切り出
しを行う。従って、文字領域が複数存在してもそれぞれ
を直ぐに行とみなすのではなく、文字領域が大き過ぎた
り、又は、文字領域同士が離れ過ぎたりしないかを判定
して汚れか、文字の一部かを判定する。よって、確実に
行の切り出しが行なえ、読取った文字の認識性能の向上
を図ることができる。
〔発明の効果〕
以上説明したように、本発明によれば、文字の配列方向
の投影データの分布をとり、予め決められた枠内に文字
領域がスペース領域を挾んで複数ある場合に、文字領域
の幅とスペース領域の幅とに基づいた判定により行切り
出しを行う。従って、確実に行の切り出しが行なえ、読
取った文字の認識性能の向上を図ることができるという
効果がある。
【図面の簡単な説明】
第1図は本発明に係る光学式文字読取装置の一実胸例を
示すブロック図、 第2図(a)、(b)は従来の行切り出し処理の内容を
説明するための説明図、 第3図は本実施例のパターンメモリに格納される2値パ
ターンを説明するための説明図、第4図は本実施例の2
値パターンを水平方向に投影して得られた投影データを
示す説明図である。 1・・・光学的読取部 5・・・2値化手段 6・・・パターンメモリ 7・・・水平方向投影部 8・・・行切り出し判定部 9・・・文字認識部 P・・・原稿

Claims (1)

  1. 【特許請求の範囲】 原稿に記載された文字を光学的に読取りアナログ電気信
    号に変換する読取手段と、 このアナログ電気信号を2値パターンに変換する2値化
    手段と、 この変換された2値パターンを格納するパターンメモリ
    と、 この格納された2値パターンから読取った文字を認識す
    る認識手段とを有する光学式文字読取装置において、 上記パターンメモリに格納された2値パターンを原稿に
    おける文字の配列方向に加算して2値パターンの投影デ
    ータをとる投影手段と、 予め決められた枠内に、投影データの値が所定値より大
    きい文字領域が、投影データの値が所定値以下となるス
    ペース領域を挾んで複数ある場合に、上記文字領域の幅
    と上記スペース領域の幅とに基づいた判定により行切り
    出しを行う判定手段とを有することを特徴とする光学式
    文字読取装置。
JP2051239A 1990-03-02 1990-03-02 光学式文字読取装置 Pending JPH03252892A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2051239A JPH03252892A (ja) 1990-03-02 1990-03-02 光学式文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2051239A JPH03252892A (ja) 1990-03-02 1990-03-02 光学式文字読取装置

Publications (1)

Publication Number Publication Date
JPH03252892A true JPH03252892A (ja) 1991-11-12

Family

ID=12881394

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2051239A Pending JPH03252892A (ja) 1990-03-02 1990-03-02 光学式文字読取装置

Country Status (1)

Country Link
JP (1) JPH03252892A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7352897B2 (en) 2001-09-27 2008-04-01 Canon Kabushiki Kaisha Method and means for dividing an image into character image lines, and method and apparatus for character image recognition

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7352897B2 (en) 2001-09-27 2008-04-01 Canon Kabushiki Kaisha Method and means for dividing an image into character image lines, and method and apparatus for character image recognition

Similar Documents

Publication Publication Date Title
US7077323B2 (en) Bar code recognizing method and decoding apparatus for bar code recognition
JPH04275772A (ja) 画像読み取り装置
JPH0147828B2 (ja)
KR890002473B1 (ko) 문자인식방식
JPH03252892A (ja) 光学式文字読取装置
JP3828276B2 (ja) 画像処理装置
JPS61289476A (ja) 文字読取装置のフオ−マツト生成方式
JPS61148971A (ja) 画像処理システム
JPH0373916B2 (ja)
JPH0119193B2 (ja)
JP2964980B2 (ja) 光学的文字認識における直線成分検出方法及び装置
JPH064705A (ja) 画像処理装置
JPS6355685A (ja) 光学式文字読取装置
JPH02103685A (ja) 網点領域分離装置
JP2897351B2 (ja) マーカー除去装置
JPS5856076A (ja) 光学的文字読取装置
JPS5914078A (ja) 帳票読取装置
JPS5878270A (ja) 光学的文字読取り装置
JPH11328332A (ja) 帳票の搬送状態識別方法およびその装置
JPH04167193A (ja) 文字認識方法
JPH0210471B2 (ja)
JPS6077278A (ja) 文字記入領域判別回路
JPS60241181A (ja) 光学式読取装置
JPS6358427B2 (ja)
JPS59158477A (ja) 光学的文字読取装置