JP2722550B2 - 光学文字読取装置 - Google Patents

光学文字読取装置

Info

Publication number
JP2722550B2
JP2722550B2 JP63281292A JP28129288A JP2722550B2 JP 2722550 B2 JP2722550 B2 JP 2722550B2 JP 63281292 A JP63281292 A JP 63281292A JP 28129288 A JP28129288 A JP 28129288A JP 2722550 B2 JP2722550 B2 JP 2722550B2
Authority
JP
Japan
Prior art keywords
character
small area
block
image
area block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63281292A
Other languages
English (en)
Other versions
JPH02128293A (ja
Inventor
康治 板本
康雄 西嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP63281292A priority Critical patent/JP2722550B2/ja
Publication of JPH02128293A publication Critical patent/JPH02128293A/ja
Application granted granted Critical
Publication of JP2722550B2 publication Critical patent/JP2722550B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、文字を画像として認識し、光電変換により
読み取りを行う光学文字読取装置に関し、特に、一つの
文字と他の文字とが不要な線分によって接続されている
文字列、いわゆる続け字の文字列を読み取ることのでき
る光学文字読取装置に関する。
〔従来の技術〕
従来、この種の光学文字読取装置は、画像入力回路で
文字を文字画像データとして認識した後、その文字画像
データに投影を行い、文字領域検出回路で文字列を含む
文字領域を検出して、その文字領域から文字画像切出回
路で1文字単位に文字画像を切り出し、この切り出され
た文字画像の大きさを正規化回路で正規化して、文字判
定回路でいずれの文字であるかを判定していた。
前記文字画像切出回路は、いわゆる続け字を切り出す
場合には、接続した2文字を1つの文字画像として切り
出したのち、その文字画像の略中央で強制的に2分割し
て、その分割されたそれぞれを1文字分の文字画像とし
て切り出していた。
〔解決すべき課題〕
上述した従来の光学文字読取装置は、続け字を切り出
す場合に、文字画像を一律に2分割して切り出していた
ので、実際の1文字分の文字画像がその範囲内に完全に
納まらない場合があり、文字画像の一部が欠けてしまっ
たり、逆に切り出したもう一方の範囲内に混入してしま
ったりして、続け字の正確な読み取りや判定ができない
という欠点があった。
また、その切り出した範囲内に、続け字の文字間を接
続する線分の文字画像の一部が混入する場合もあり、そ
の不要な文字画像までも読み取ってしまうので、誤判定
の原因になるという欠点があった。
特に、文字が斜めに傾き、しかも投影方向に重なり合
う部分を有する続け字の文字列の場合には、正確な読み
取りや判定が、非常に困難であった。
本発明の目的は、上述した課題を解決して、文字と文
字とが不要な線分で接続されている続け字の文字列でも
正確に読み取ることができる光学文字読取装置を提供す
ることである。
〔課題の解決手段〕
本発明による光学文字読取装置は、文字を画像として
入力し文字画像データとして出力する画像入力手段と、
前記文字画像データから文字列を含む文字領域を検出す
る文字領域検出手段と、前記文字領域から1文字単位に
文字画像を切り出す文字画像切出手段と、前記文字画像
の大きさを正規化する正規化手段と、前記正規化された
文字画像を特定の文字であると判定する文字判定手段と
かなる光学文字読取装置において、前記文字画像切出手
段は、前記文字領域を複数の小領域に分割した各小領域
の中に含まれる前記文字画像の連続した画線部のみを小
領域ブロックとして切り出しその小領域ブロックの位置
を座標で表記する小領域ブロック切出手段と、前記小領
域ブロック切出手段で切り出した前記小領域ブロックが
他の隣接する小領域ブロックと接続しているか否かを前
記座標を用いて検出する小領域ブロック接続検出手段
と、前記小領域ブロック接続検出手段で検出した隣接し
て接続する前記小領域ブロックの集合の幅を検出する集
合ブロック幅検出手段と、前記集合ブロック幅検出手段
で検出した前記小領域ブロックの集合の幅と予め付与さ
れた幅情報とを比較照合してその小領域ブロックの集合
が複数の文字を有する続け字か否かを判断する続け字判
断手段と、前記続け字判断手段で続け字と判断した前記
小領域ブロックの集合の中から、ブロックの大きさが所
定の大きさより小さいブロックを続け字の文字間を接続
する線分が含まれた小領域ブロックとして検出し、その
小領域ブロックを除去する続け字線分検出除去手段と、
前記続け字線分検出除去手段で続け字の線分を含む小領
域ブロックが除去された前記小領域ブロックの集合から
1文字単位に文字画像を抽出しその文字画像を出力する
文字抽出手段とから構成されている。
〔実施例〕
つぎに、本発明について図面を参照して説明する。
第1図は、本発明による光学文字読取装置の一実施例
を示したブロック図、第2図〜第4図は、同実施例装置
に使用する文字画像切出回路の動作を説明するための図
である。
本発明による光学文字読取装置は、画像入力回路1
と、文字領域検出回路2と、文字画像切出回路3と、正
規化回路4と、文字判定回路5とから構成されている。
画像入力回路1は、文字を入力して光電変換を行い、
文字画像データとして出力する回路である。
文字領域検出回路2は、画像入力回路1が出力した文
字画像データに対して縦,横に投影を行い、その結果を
処理して文字列を含む領域を検出する回路である。
文字画像切出回路3は、文字領域検出回路2で検出し
た文字列を含む領域から、1文字ごとの文字画像を切り
出す回路であり、後述するように、さらに小領域ブロッ
ク切出回路31と、小領域ブロック接続検出回路32と、分
離抽出回路33とから構成されている。分離抽出回路33
は、さらに集合ブロック幅検出回路331と、続け字判断
回路332と、続け字線分検出除去回路333と、文字抽出回
路334とから構成されている。
正規化回路4は、文字画像切出回路3で切り出さした
1文字ごとの文字画像の大きさを正規化する回路であ
る。
文字判定回路5は、正規化回路4で正規化した1文字
ごとの文字画像がどのような文字であるかを判定する回
路である。
つぎに、第2図〜第4図を用いて、文字画像切出回路
3の動作を中心にして本発明をさらに詳しく説明する。
画像入力回路1から出力された文字画像データは、文
字領域検出回路2に入力される。文字領域検出回路2
は、その文字画像データの中から文字列を含む領域を検
出して、その領域を文字画像切出回路3に出力する(第
2図(a))。
まず、小領域ブロック切出回路31は、第2図(b)に
示すように、入力した文字列を含む領域を縦方向に複数
の小領域A1〜A12に分割する。この後、それぞれの小
領域A1〜A12について投影を行い、各小領域ごとに含
まれる文字画像の連続した画線部のみを小領域ブロック
として切り出す。例えば、小領域A1から小領域ブロッ
クを切り出すと、「7」の文字画像の画線部のうち、そ
の一部が2つの小領域ブロックa1,1およびa1,2として
切り出される(第2図(c))。同様にして各小領域ご
とに含まれる画線部を小領域ブロックとして切り出す。
こうして切り出された各小領域ブロックの大きさを座標
で表し、第3図に示すように、小領域Anから切り出さ
れた小領域ブロックan,1は、それぞれxsan,1,xlan,1,y
san,1、ylan,1のように表記する。
つぎに、小領域ブロック接続検出回路32では、各小領
域A1〜A12から切り出された各小領域ブロック同士
が、隣接する2つの小領域の境界で接続しているか否か
の関係を調べる。例えば、第2図(c)に示すように、
小領域A1内の小領域ブロックa1,1と小領域A2内の小
領域ブロックa2,1が、接続しているか否かを調べる場
合に、それぞれの座標は、以下のように表される。
1,1=(xsa1,1、xla1,1、ysa1,1、yla1,1) …(1) a2,1=(xsa2,1、xla2,1、ysa2,1、yla2,1) …(2) (1)と(2)の座標を比較すると、 xla1,1=xsa2,1 ysa1,1<ysa2,1<yla1,1 であり、明らかに小領域ブロックa1,1と小領域ブロッ
クa2,1は、隣接する2つの小領域の境界で接続してい
ることがわかる。
一般に、隣接する2つの小領域AnとAn+1に含まれる
小領域ブロックan,pとan+1,qにおいて、以下の式が成
り立つときに、2つの小領域ブロックは接続していると
みなす。
xlan,p=xsan+1,q …(3) ysan,p≦ysan+1,q≦ylan,p または、 ysan,p≦ylan+1,q≦ylan,p …(4) このようにして、全ての小領域A1〜A12から切り出さ
れた小領域ブロックの接続関係を検出する(第4図
(a),(c))。なお、接続した小領域ブロックの集
合を、以下単に集合ブロックという。
小領域ブロック接続検出回路32は、こうして検出した
各小領域ブロック間の接続情報と各小領域ブロックの座
標を分割抽出回路33に出力する。
つぎに、分離抽出回路33について、第2図および第4
図を用いて、その構成を各部の動作とともにさらに詳し
く説明する。
分離抽出回路33は、小領域ブロック接続検出回路32か
ら出力された各小領域ブロック間の接続情報と各小領域
ブロックの座標に基づき、1文字単位に文字画像を抽出
回路である。
集合ブロック幅検出回路331は、小領域ブロック接続
検出回路32で検出した集合ブロックの幅を検出する回路
である。
例えば、第4図(a)に示す「7」、および同図
(c)に示す「80」は、それぞれの集合ブロックの幅
を、(a)について(xla4,1‐xsa1,2、(c)について
は(xla12,1‐xsa3,3)と求めることができる。こうし
て求めた各集合ブロックの幅の情報は、次段の続け字判
断回路332に出力される。
続け字判断回路332は、集合ブロック幅検出回路331か
ら出力された各集合ブロックの幅情報と、予め付与され
ている1文字分の文字画像の幅情報とを比較照合し、そ
れらの各集合ブロックが1文字であるか,続け字である
かを判断する回路である。
いま、予め付与されている1文字分の文字画像の幅情
報が、例えば、第4図(a)に示す集合ブロックの幅
(xla4,1‐xsa1,2)と略同程度とすると、第4図(a)
の集合ブロックは1文字であると判断される。一方、第
4図(c)に示す集合ブロックの幅は、予め付与されて
いる1文字分の文字画像の幅情報の略2倍であるため、
第4図(c)の集合ブロックは、2文字が接続した続け
字の文字列と判断される。この後、続け字判断回路332
は、文字画像を1文字と判断した場合には、各小領域ブ
ロック間の接続情報と各小領域ブロックの座標とを、文
字抽出回路334に出力する。一方、続け字の文字列と判
断した場合には、それらの情報を、次段の続け字線分検
出除去回路333に出力する。
続け字線分検出除去回路333は、続け字判断回路332で
続け字の文字列と判断された集合ブロックの中から、文
字間を接続している不要な線分を含む小領域ブロックを
検出して、それを除去する回路である。
続け字線分検出除去回路333は、この小領域ブロック
の検出・除去のために、続け字の集合ブロックを桁数
(第4図(d)の「80」は、2桁なので「2」が桁数と
なる)で分割する。その後、続け字線分検出除去回路33
3は、集合ブロックを分割した際、その境界付近に存在
する小領域ブロックの接続関係とその大きさを調べる。
その結果、特定の小領域ブロックが、その左右端でそれ
ぞれ他の小領域ブロックと1対1で接続し、その特定の
小領域ブロックの大きさが十分小さい場合に、その特定
の小領域ブロックは、文字間を接続する不要な線分を有
するものとして検出される。
例えば、第4図(c)に示す集合ブロックの場合に
は、2桁分の幅を有するので、続け字線分検出除去回路
333は、その集合ブロックの中央付近に存在する小領域
ブロックa6,1〜a9,3の接続関係と、それぞれの大きさ
を調べる。この内、中央付近で左右と1対1で接続して
いる小領域ブロックは、a7,1〜a9,1であり、さらにa
8,1とa9,1は、第2図(c)に示すように、大きさ(高
さ)が十分小さい。こうして小領域ブロックa8,1とa
9,1は、左右と1対1で接続し、かつ大きさが十分小さ
い続け字の線分を含む小領域ブロックとして検出され
る。
この後、続け字線分検出除去回路333は、第4図
(e)および(f)に示すように、小領域ブロックa
8,1とa9,1を除去し、その左右の集合ブロックを、それ
ぞれ独立した別個の集合ブロックに分離する。続け字線
分検出除去回路333は、分離した集合ブロックのそれぞ
れの接続情報a3,3〜a7,1とa8,2〜a12,1、並びにそ
れらの小領域ブロックの座標を文字抽出回路334に出力
する。
文字抽出回路334は、続け字線分検出除去回路333より
出力された各小領域ブロック間の接続情報と座標に基づ
いて、1文字単位の文字画像を抽出して正規化回路4へ
出力する回路である。第4図(b)、(g)および
(h)は、文字抽出回路334によって抽出された文字画
像の一例を示した図である。
こうして、文字画像切出回路3に含まれる分離抽出回
路33が1文字単位に抽出した文字画像は、正規化回路4
へ出力されて、その正規化回路4で大きさを正規化した
のち、文字判定回路5でそれぞれ別個の文字であると判
定される。
〔発明の効果〕
以上、詳しく説明したように、本発明による光学文字
読取装置は、文字列を複数の小領域に分割し、各小領域
の中に含まれる画線部のみを小領域ブロックとして切り
出して、その位置の座標を検出し、この小領域ブロック
と接続している他の小領域ブロックの集合の幅を検出す
ることにより、その文字列が続け字か否かを判断し、こ
の後、続け字の不要な線分を除去して1文字単位に文字
画像を切り出す。従って、1文字単位の文字画像の切り
出しでは困難であった、続け字の文字列、特に斜めに傾
き、かつ投影方向に重なり合う部分を有する文字列の場
合であっても正確に読み取ることができるという効果が
ある。
【図面の簡単な説明】
第1図は、本発明による光学文字読取装置の一実施例を
示したブロック図、第2図〜第4図は、同実施例装置に
使用される文字画像切出回路の動作を説明するための図
である。 1……画像入力回路 2……文字領域検出回路 3……文字画像切出回路 31……小領域ブロック切出回路 32……小領域ブロック接続検出回路 33……分離抽出回路 331……集合ブロック幅検出回路 332……続け字判断回路 333……続け字線分検出除去回路 334……文字抽出回路 4……正規化回路、5……文字判定回路 A1〜A12……小領域 a1,1〜a12,1……小領域ブロック xsan,1、xlan,1……小領域ブロックan,1のx座標 ysan,1、ylan,1……小領域ブロックan,1のy座標

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】文字を画像として入力し文字画像データと
    して出力する画像入力手段と、前記文字画像データから
    文字列を含む文字領域を検出する文字領域検出手段と、
    前記文字領域から1文字単位に文字画像を切り出す文字
    画像切出手段と、前記文字画像の大きさを正規化する正
    規化手段と、前記正規化された文字画像を特定の文字で
    あると判定する文字判定手段とからなる光学文字読取装
    置において、 前記文字画像切出手段は、前記文字領域を複数の小領域
    に分割し各小領域の中に含まれる前記文字画像の連続し
    た画線部のみを小領域ブロックとして切り出しその小領
    域ブロックの位置を座標で表記する小領域ブロック切出
    手段と、 前記小領域ブロック切出手段で切り出した前記小領域ブ
    ロックが他の隣接する小領域ブロックと接続しているか
    否かを前記座標を用いて検出する小領域ブロック接続検
    出手段と、 前記小領域ブロック接続検出手段で検出した隣接して接
    続する前記小領域ブロックの集合の幅を検出する集合ブ
    ロック幅検出手段と、 前記集合ブロック幅検出手段で検出した前記小領域ブロ
    ックの集合の幅と予め付与された幅情報とを比較照合し
    て、その小領域ブロック集合が複数の文字を有する続け
    文字か否かを判断する続け字判断手段と、 前記続け字判断手段で続け字と判断した前記小領域ブロ
    ックの集合の中から、ブロックの大きさが所定の大きさ
    より小さいブロックを続け字の文字間を接続する線分が
    含まれた小領域ブロックとして検出し、その小領域ブロ
    ックを除去する続け字線分検出除去手段と、 前記続け字線分検出除去手段で続け字の線分を含む小領
    域ブロックが除去された前記小領域ブロックの集合から
    1文字単位に文字画像を抽出し、その文字画像を出力す
    る文字抽出手段とから構成したことを特徴とす光学文字
    読取装置。
JP63281292A 1988-11-09 1988-11-09 光学文字読取装置 Expired - Lifetime JP2722550B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63281292A JP2722550B2 (ja) 1988-11-09 1988-11-09 光学文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63281292A JP2722550B2 (ja) 1988-11-09 1988-11-09 光学文字読取装置

Publications (2)

Publication Number Publication Date
JPH02128293A JPH02128293A (ja) 1990-05-16
JP2722550B2 true JP2722550B2 (ja) 1998-03-04

Family

ID=17637034

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63281292A Expired - Lifetime JP2722550B2 (ja) 1988-11-09 1988-11-09 光学文字読取装置

Country Status (1)

Country Link
JP (1) JP2722550B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0465784A (ja) * 1990-07-05 1992-03-02 Nec Corp 文字切出し回路

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07120390B2 (ja) * 1985-11-22 1995-12-20 沖電気工業株式会社 文字切出し方法
JPS63163684A (ja) * 1986-12-26 1988-07-07 Toshiba Corp 文字パタ−ン切出し装置

Also Published As

Publication number Publication date
JPH02128293A (ja) 1990-05-16

Similar Documents

Publication Publication Date Title
US4481665A (en) Character segmentation method
JP3805005B2 (ja) 画像処理装置及び光学的文字認識装置及びそれらの方法
US7194144B1 (en) Document image processing device, document image merging method, and storage medium recording a document image merging program
JP2000113103A (ja) 文書画像の方向判定方法、装置および記録媒体
JP2722550B2 (ja) 光学文字読取装置
JP2722549B2 (ja) 光学文字読取装置
JPH0660224A (ja) 光学式文字読取装置
JP2728086B2 (ja) 文字切り出し方法
JPS5949671A (ja) 光学的文字読取装置
JP3412441B2 (ja) 画像処理装置
JP2972443B2 (ja) 文字認識装置
JPH05174185A (ja) 日本語文字認識装置
JP2832035B2 (ja) 文字認識装置
JPH07118016B2 (ja) 図形認識装置
JP2728085B2 (ja) 文字切り出し方法
JPH03164885A (ja) 光学式文字読取装置
JP2813601B2 (ja) 表形式文書認識装置
JPH04148392A (ja) 光学文字読取装置
JP3162575B2 (ja) 文字認識装置
JPH0498478A (ja) 光学文字読取装置
JP2000339408A (ja) 文字切り出し装置
JPH07319942A (ja) 図面自動入力装置の線種認識方法
JPS60229178A (ja) ナンバ−プレ−ト位置検出装置
JPS63174197A (ja) ナンバ−プレ−ト位置検出装置
JPH06309503A (ja) 英文字認識装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071128

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081128

Year of fee payment: 11

EXPY Cancellation because of completion of term