JP2878327B2 - 文字切り出し装置 - Google Patents

文字切り出し装置

Info

Publication number
JP2878327B2
JP2878327B2 JP1231037A JP23103789A JP2878327B2 JP 2878327 B2 JP2878327 B2 JP 2878327B2 JP 1231037 A JP1231037 A JP 1231037A JP 23103789 A JP23103789 A JP 23103789A JP 2878327 B2 JP2878327 B2 JP 2878327B2
Authority
JP
Japan
Prior art keywords
character
pattern data
pixel
data
background
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1231037A
Other languages
English (en)
Other versions
JPH0392987A (ja
Inventor
浩史 吉田
浩一 樋口
義征 山下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP1231037A priority Critical patent/JP2878327B2/ja
Publication of JPH0392987A publication Critical patent/JPH0392987A/ja
Application granted granted Critical
Publication of JP2878327B2 publication Critical patent/JP2878327B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 (産業上の利用分野) この発明は、帳票等の媒体上の文字列より各文字を切
り出すための文字切り出し装置に関するもので、特に、
隣接する文字同志が非接触ではあるがその一部分同志が
重なりあっているような文字(以下、オーバーラップ文
字と称することもある。)を含む文字列より各文字を切
り出す際に好適な文字切り出し装置に関する。
(従来の技術) 機械が文字図形を自動的に識別出来れば、例えばコン
ピュータへのデータ入力を人間が行なうより効率良くか
つ正確に行なうことが出来る等、種々の利点が得られ
る。このため、文字認識装置に関する研究が従来から盛
んに行なわれている。
しかし、このような文字認識装置を実現するために
は、媒体上の入力文字列からの光を光電変換量子化して
得た入力文字列データより、1文字分づつの文字パタン
データを正確に切り出しこれを辞書と照合する必要があ
る。
そこで、入力文字列データより各文字パタンデータを
正確に切り出せる文字切り出し装置が必要になる。
従来、例えばラインバッファメモリ等に行単位に格納
された入力文字列データから1文字分の文字パタンデー
タを切り出す装置としては、入力文字列データを文字列
方向(主走査方向)と直交する方向(以下副走査方向と
称することもある。)に順次に走査し、各副走査線上の
文字線部分を表わす黒ビットの数から黒ビットのヒスト
グラムを作成し、該黒ビットの数を予め定めた閾値Sと
比較し、黒ビット数がS以上となり再びSより小さい値
となる領域のデータを文字パタンデータとして切り出す
装置が広く知られていた。
しかし、上述の文字切り出し装置では、一般の英文文
書等において煩出する。第9図(A)に示すような隣接
する文字同志が非接触ではあるが互いの一部同志が重な
っているような文字11(オーバーラップ文字)について
は、両文字の境界部分におても黒ビット数が大きな値に
なるので、個々の文字に切り出すことが出来なかった。
そこで、このような問題を解決出来る文字切り出し装
置として、例えば特公昭62-46039公報に開示されている
ものがあった。
特公昭62-46039号公報に開示の文字切り出し装置は、
帳票上の一定幅の帯状の枠内に記入された文字列を読み
取る際に、まず、該枠の上枠より下枠に向っての垂直方
向(副走査方向)の各文字までの距離を文字列方向にお
いて順に求め、同様に下枠より上枠に向っての距離を求
め、上枠から及び下枠からのそれぞれの距離の分布にお
いてその変化が所定値以上であった点を変化点としてそ
れぞれ検出する。次に、上枠からの距離の分布において
検出された第1の変化点と、下枠からの距離の分布にお
いて検出された第2の変化点との間の少なくとも文字例
方向における距離が所定距離内にある1対の変化点を1
つの組として検出し、これら第1及び第2の変化点を用
い文字の切り出し位置を決定するものであった。
(発明が解決しようとする課題) しかしながら、特公昭62-46039号公報に開示の文字切
り出し装置であってもオーバーラップ文字を個々の文字
に充分に切り出すことが出来なかった。以下、具体例を
挙げて説明する。
例えば「eX」なる文字塊において「X」の左上部分及
び左下部分が「e」の右上部分及び右下部分にそれぞれ
オーバーラップしている場合、この文字塊を光電変換及
び量子化した入力文字列データは、第9図(A)に11で
示したようになる。従って、このような入力文字列デー
タ11から文字パタンデータを、特公昭62-46039号公報に
開示の文字切り出し装置で切り出す場合、第9図(B)
に示すような変化点13が検出され、従って、「e」につ
いては第9図(C)に示すように、「X」については第
9図(D)に示すように、異常な文字パタンデータ15a,
15bとして切り出されてしまうという問題点があった。
このように文字が切り出されると、誤認識の原因にな
る。
さらに、特公昭62-46039号公報に開示の文字切り出し
装置では、上枠及び下枠から文字線までのそれぞれの距
離の変化の検出、変化点の検出、上枠組及び下枠側の各
々の変化点から1点づつを選んでの変化点の組合せの作
成、文字切り出し位置の算出、入り組んだ文字切り出し
線を用いた文字の切り出しという処理を行なわなければ
ならず、処理が複雑であり、この結果処理速度が遅くな
るという問題点があった。このような問題があると、文
字認識を高速で行なうことが出来ない。
この発明はこのような点に鑑みなされたものであり、
従ってこの発明の目的は、上述の問題点を解決し、オー
バーラップ文字が含む文字列からであっても従来に比し
簡単な操作で然も正確に文字を切り出すことが出来る文
字切り出し装置を提供することにある。
(課題を解決するための手段) この目的の達成を図るため、この出願に係る発明者は
種々の検討を重ねた。その結果、切り出し対象文字列
の、これを横切る方向における文字背景部の連なり具合
を検出しこのうち特に文字列を分断している文字背景部
の連なりを検出してこの部分で文字列を区切ればオーバ
ーラップ文字を個々の文字に分離出来ることに着目しこ
の発明を完成するに至った。
従ってこの発明によれば、媒体上の文字列からの光を
光電変換し量子化された入力文字列データを得、この入
力文字列データより1文字分づつの文字パタンデータを
切り出す文字切り出し装置において、 (イ)入力文字列データの一部又は全部に外接する四角
形状の枠についての該入力文字列データを格納している
メモリ上での座標を検出し、この外接枠内をこれの文字
列方向と平行な一方の辺から他方の辺に向って前述の文
字列方向を主走査方向として順次に走査すると共に、前
述の一方の辺から前記他方の辺までの文字背景部の連な
り方を表す背景伝搬パタンデータを作成する背景伝搬パ
タン作成部と、 (ロ)前述の背景伝搬パタンデータにおける前述の他方
の辺上の文字背景部を検出し、この文字背景部に基づい
て前記入力文字列データの前述の外接枠内の部分に含ま
れる文字間の間隔を検出する切り出しアドレス検出部
と、 (ハ)前述の切り出しアドレスに基づいて前述の入力文
字列データの前述の外接枠内の部分から文字パタンデー
タを切り出す文字切り出し部とを具えたことを特徴とす
る。
なおこの発明の実施に当たり、 入力文字列データより文字塊パタンデータを切り出す
文字塊切り出し部と、 この文字塊パタンデータ内に含まれる文字パタン数を
判定すると共に、文字パタン数が1と判定された場合は
この文字塊パタンデータを文字パタンデータとしてその
まま出力し、文字パタン数が2以上と判定された場合は
この文字塊パタンデータを前述の背景伝搬パタン作成部
及び文字切り出し部に対し出力する字数判定部とを更に
設けるのが好適である。
さらにこの発明の実施に当たり、前述の背景伝搬パタ
ン作成部を、 (a)前記走査において各画素につき該画素が文字線部
であるか文字背景部であるかを検定し、 (b)被検定画素が文字線部である場合はメモリの該被
検定画素に対応するアドレスに第1の所定値を格納し、 (c)被検定画素が文字背景部である場合で該被検定画
素が含まれる走査線の直前の走査線上の該被検定画素近
傍の複数の画素のうちの少なくとも1つの画素に対し該
直前の走査線よりさらに1本直前の走査線から文字背景
部が連なっている場合には、該被検定画素に文字背景部
が連なっていると認定すると共に、前記少なくとも1つ
の画素が前記複数の画素の中のどの位置に在るかに応じ
て予め定めてある所定値を前記メモリの該被検定画素に
対応するアドレスに格納し、及び (d)被検定画素が文字背景部である場合で該被検定画
素が含まれる走査線の直前の走査線上の該被検定画素近
傍の複数の画素のいずれも該直前の走査線よりさらに1
本直前の走査線から文字背景部が連なっていない場合に
は、前記メモリの該被検定画素に対応するアドレスに前
記第1の所定値を格納する 背景伝搬パタン作成部とすることが好適である。
(作用) この発明の文字切り出し装置によれば、入力文字列デ
ータを順次走査するだけで文字背景部の連なり具合を示
す背景伝搬パタンが得られ、これから文字間の間隔が検
出出来る。従って、文字の輪郭等を追跡しオーバーラッ
プ文字における文字の区切りを検出するような場合より
も、処理が簡単である。
また、文字塊切り出し部を設けることにより入力文字
データを小分けでき、さらに、字数判定部を設けること
により、文字塊切り出し部によって切り出された文字塊
パタンデータが1文字から成るものなのかオーバーラッ
プ文字から成るものなのかの判定が出来る。従って、文
字塊パタンデータの切り出しを既知の簡単な方法で行な
っても、オーバーラップ文字についてはその後に適格な
処理が行なわれる。然も、オーバーラップ文字から成る
文字塊パターンデータについてのみ、背景伝搬パタン作
成や文字パタンデータへの分離という処理が行なわれる
だけであるので、全体的な文字切り出し時間は非常に短
くて済む。
(実施例) 以下、図面を参照してこの出願の文字切り出し装置の
実施例につい説明する。
文字切り出し装置の構成の説明 第1図は、実施例の文字切り出し装置を組み込んだ文
字認識装置の構成を概略的に示したブロック図である。
第1図において、100は文字認識装置、200は実施例の
文字切り出し装置、100aは媒体上例えば帳票上の文字列
からの光信号、100bは光信号100aを光電変換し量子化さ
れた入力文字行データ(詳細は後述する。)を得るため
の前処理部、100cは文字列より文字切り出し装置200に
よって切り出された文字パタンデータを格納するパタン
レジスタ、100dは文字パタンデータから特徴を抽出しこ
れを予め用意されている辞書の標準文字パタンの特徴と
照合して文字の認識をする認識部、100eは認識した文字
の文字名を例えば外部コンピュータ、表示装置等に出力
するための文字名出力端子をそれぞれ示す。
ここで前処理部100bは、媒体上の文字列を文字線部に
ついては黒ビット、文字背景部については白ビットで表
現した2値のディジタル信号(この信号が入力文字列デ
ータに相当する。)に変換出来るイメージラインセンサ
から成る光電変換部100xと、この入力文字列データを2
次元座標が再現出来る形式で記憶出来る例えば128×409
6画素の容量を有するラインバッファ100yとで構成して
ある。
またこの実施例の文字切り出し装置200は、前処理部1
00bで得た入力文字行データより文字塊パタンデータを
切り出す文字塊切り出し部201と、字数判定部203と、背
景伝搬パタン作成部205と、切り出しアドレス検出部207
と、文字切り出し部209とを具える。
ここで、文字塊切り出し部201は、入力文字列データ
を文字列方向と直交する方向(副走査方向)に順次に走
査し、各副走査線上の黒ビットによるヒストグラムを作
成し、このヒストグラムにおいて黒ビット数が予め定め
た第1の閾値以上となる列が予め定められた第2の閾値
以上連続する区間を文字塊パタンデータとして切り出す
回路である。この文字塊切り出し部201は、比較回路、
カウンタ回路、メモリ等を用いた従来公知の回路で構成
出来る。
また、字数判定部203は、文字塊切り出し部201によっ
て切り出された文字塊パタンデータの文字線部(黒ビッ
ト部)に外接する四角形状の枠を検出し該枠の縦横比に
基づいて該文字塊パタンデータ中に含まれる文字パタン
データ数を判定すると共に、この判定において、文字パ
タン数が1と判定された場合は該文字塊パタンデータを
文字パタンデータとしてパタンレジスタ100cにそのまま
出力し、文字パタン数が2以上と判定された場合は該文
字塊パタンデータを背景伝搬パタン作成部205及び文字
切り出し部209に対し出力する回路である。字数判定部2
03についての詳細な説明は、後述の動作説明の項にて項
なう。
また、背景伝搬パタン作成部205は、字数判定部203に
よって文字パタン数が2以上であると判定された文字塊
パタンデータ(即ち入力文字列データの一部)につき、
字数判定部203で検出した外接枠内をこれの文字列方向
と平行な一方の辺から他方の辺に向って文字列方向を主
走査方向として順次に走査すると共に、前述の一方の辺
から前述の他方の辺までの文字背景部の連なり方を表す
背景伝搬パタンデータを作成する回路である。背景伝搬
パタン作成部205についての詳細な説明は、後述の動作
説明の項にて行なう。
また、切り出しアドレス検出部207は、背景伝搬パタ
ン作成部205によって作成された背景伝搬パタンデータ
の他方の辺上の文字背景部を検出し、この文字背景部に
基づいて文字塊パタンデータに含まれる文字間の間隔を
検出する回路である。
また、文字切り出し部209は、切り出しアドレス検出
部207によって検出された切り出しアドレスに基づいて
文字塊パタンデータから文字パタンデータを切り出す回
路である。
これら切り出しアドレス検出部207及び文字切り出し
部209についての詳細な説明は、後述の動作説明の項に
て行なう。
文字切り出し装置の動作説明 次に、実施例の文字切り出し装置の理解を深めるため
に、切り出し対象文字列を第2図(A)に示したような
オーバーラップ文字「eX」とした例により、この装置の
動作説明を行なう。なお、第2図(A)中、53aで示し
た領域がオーバーラップ部分である。
先ず、2図(A)の帳票51上の切り出し対象文字列
「eX」53からの光信号100aが光電変換部100xに入力され
ると、光電変換部100xは、光信号100aを黒ビット及び白
ビットで示される文字列パタンデータに変換してライン
バッファ100yに格納する。
文字塊切り出し部201は、ラインバッファ100yより入
力文字列データを読み込み、これを文字列の左端など順
次副走査方向に走査して各副走査線上の黒ビット数を計
数し、黒ビットのヒストグラムを作成する。次に、この
ヒストグラムを調べ、黒ビット数が予め定めた第1の閾
値B以上である列が予め定めた第2の閾値L以上連続し
ている領域を文字塊パタンデータとして抽出し、これを
字数判定部203に出力する。なお、この実施例の場合、
第1の閾値Bを3とし、第2の閾値Lを10として文字塊
パタンデータを抽出した。
字数判定部203は、これに備わるメモリ(図示せず)
に文字塊パタンデータを格納する。
第2図(B)は、字数判定部203のメモリ内に格納さ
れたオーバーラップ文字「eX」の文字塊パタンデータ
を、黒ビットを1とし白ビットを0として示したもので
ある。なお、もし「e」と、「X」とがオーバーラップ
していない場合、文字塊切り出し部201は、「e」及び
「X」を各々別々の文字塊パタンデータとして字数判定
図203に順に出力することは云うまでもない。
次に、字数判定部203は、文字塊切り出し部201から入
力された文字塊パタンデータについて、文字塊パタンデ
ータの文字線部に外接する枠(例えば第2図(B)に55
で示す枠)を検出し、さらにこの外接枠の幅W及び高さ
Hをそれぞれ求め、これらW及びHを用い例えば下記
(1)式に従い、この文字塊パタンデータに含まれる文
字パタン数nを判定する。
n=(k・W/H)+1……(1) 但し(1)式中、kは定数でありこの実施例ではk=
1.0としている。また、nは少数点以下を切り捨てた整
数値をとるものとする。
そして字数判定部203は、n=1と判定した場合は、
その文字塊パタンデータを文字パタンデータとしてパタ
ンレジスタ100cにそのまま出力し、n≧2と判定した場
合は、その文字塊パタンデータを背景伝搬パタン作成部
205及び文字切り出し部209に出力する。ここでは、オー
バーラップ文字「eX」の場合はW>Hとなるので、字数
判定部203は、n=2と判定する。従って、字数判定部2
03は、文字塊パタンデータを背景伝搬パタン作成部205
及び文字切り出し部209に出力する。
次に、背景伝搬パタン作成部205は、字数判定部203よ
り入力された文字塊パタンデータの外接枠の上平板(第
2図(B)中55aで示すもの)上における文字背景部を
意味する白ビットを順次下辺(第2図(B)中55bで示
すもの)方向の文字背景部に以下に説明するような手順
で伝搬させてゆき背景伝搬パタンデータを作成する。
なお、背景伝搬パタンデータは、文字塊パタンデータ
と同一の2次元座標で定義されるものとしている。そし
て、この実施例の場合の背景伝搬パタンデータは、各画
素に対し以下に説明するような方法で付与される1〜4
のいずれかの値の集合体で構成され、各画素毎に2ビッ
トの容量が割り当てられた背景伝搬パタンレジスタ(図
示せず)に記憶されるものとしている。
始め背景伝搬パタン作成部205は、第2図(B)に示
した文字塊パタンデータを、上辺55aから下辺55b方向に
向って文字列方向に平行な方向を主走査方向として順次
走査を行ない、各画素が「1」か「0」かを検定する。
次に、この検定において、被検定画素が「1」であっ
た場合には背景伝搬パタンレジスタ(図示せず)の該被
検定画素に対応するアドレスに、第1の所定値としての
文字線部を意味する「1」を格納する。一方、被検定画
素が「0」であった場合には、該被検定画素が含まれる
走査線の直前の走査線上の該被検定画素近傍の複数の画
素のうちの少なくとも1つの画素に対し該直前の走査線
よりさらに1本直前の走査線から文字背景部が伝搬され
ているか否かを判定しその結果に応じ1〜4のうちいず
れかの値を、背景伝搬パタンレジスタ(図示せず)の該
被検定画素に対応するアドレスに格納する。1〜4のう
ちいずれの値を格納するかの決定は、実際には、被検定
画素が含まれる走査線より1ライン上の走査線の被検定
画素と同一の副走査線上にある画素とこの画素の左右1
つづつの画素、合計3個の画素に対応する背景伝搬パタ
ンレジスタ内の値(1〜4)によって決定する。第3図
(A)〜(D)はその説明に供する図であり、61は背景
伝搬パタンレジスタ内の被検定画素に対応するアドレス
に格納されている値、63は被検定画素61が含まれる走査
線より1ライン上の走査線の被検定画素と同一の副走査
線上にある画素に対応するアドレスに格納されている
値、65a,65bはこの画素の左右の画素に対応するアドレ
スに格納されている値をそれぞれ示す。ここで、レジス
タ内に1が記憶されている場合(61,63,65a,65b等が1
である場合)は、これに対応する画素は文字線部である
ことを意味し、また、Δが記憶されている場合(61,63,
65a,65b等がΔである場合)はこれに対応する画素は文
字背景部でありかつ上辺方向へ文字背景部のつながりが
ありその方向に応じた2〜4のいづれかの値が記憶され
ていることを意味する。そしてこの実施例の背景伝搬パ
タン作成部205は、被検定画素より1ライン上の前記3
画素の背景伝搬パタンレジスタ内の値65a,63,65bが2〜
4のうちのいくつであるかによって、被検定画素の背景
伝搬パタンレジスタに格納させる値61を、下記第1表の
ように決定する。
ここで、上述のように決定された2〜4の値は、これ
ら値の決定方法からも明らかなように、被検定画素から
上方向(上辺方向)へ向っての文字背景部の連なり方を
表わす値でもあり、この値が2の場合は左上に、3の場
合は真上に、4の場合は右上に文字背景部が連なってい
ることを表わしている。第4図(A)〜(C)はその様
子を示したもので、各図中Pが文字背景部の連なり方向
である。
次に、背景伝搬パタン作成部205の上述のような処理
の具体的な説明を、第2図(B)に示した文字塊パタン
データの第12〜第21列目の画素に対応する背景伝搬パタ
ンデータを作成する例により行なう。
先ず、文字塊パタンデータの第1ライン目を走査し背
景伝搬パタンデータの第1ライン目のデータを作成する
訳であるが、この場合、文字塊パタンデータの第1ライ
ン目より上にはデータが無いので、参照すべき背景伝搬
パタンデータも無い。従って、この実施例では、ライン
のデータが1以外の数(2〜4)で構成された第Oライ
ン目の背景伝搬パタンデータが在るものと仮想して、第
1ライン目のデータを作成する。第5図(A)は、その
説明に供する図であり、図中、71は文字塊パタンレジス
タ及び背景伝搬パタンレジスタ各々の列方向のアドレス
を示す列番号であり、72は仮想した第Oライン目の背景
伝搬パタンデータ、73は文字塊パタンデータの第1ライ
ン目のデータ、74は背景伝搬パタンデータの第1ライン
目のデータをそれぞれ示す。仮想した第Oライン目の背
景伝搬パタンデータは全てΔ(2〜4のいづれかの値)
であるので、背景伝搬パタンデータの第1ライン目の第
12〜21列までのデータは、第1ライン目の文字塊パタン
データが「0」である画素に対応するものが「3」にな
り「1」である画素に対応するものが「1」になり、
「3331111111」になる。
次に、文字塊パタンデータの第2ライン目のデータを
走査し背景伝搬パタンデータの第2ライン目を作成す
る。これは、文字塊パタンデータの第2ライン目のデー
タと、上述の如く作成した背景伝搬パタンデータの第1
ライン目のデータとを用い、背景伝搬パタンデータの第
1ライン目を作成した方法と同様に行なえる。第5図
(B)はその説明に供する図であり、図中、75は文字塊
パタンデータの第2ライン目のデータ、76は作成された
背景伝搬パタンデータの2ライン目のデータを示す。第
5図(B)において、例えば文字塊パタンデータの第2
ライン目の第19列目の画素(被検定画素)は「1」であ
るので、背景伝搬パタンデータの被検定画素に対応する
アドレスには「1」が格納されている。また、第5図
(B)において、例えば文字塊パタンデータの第2ライ
ン目の第15列目の画素(被検定画素)は「0」であるの
で、この場合は背景伝搬パタンデータの1ライン目のデ
ータのうちの第14〜16列の値を調べる。第14〜16列の値
は「311」即ち第3図(C)に示した「Δ11」の状態で
あるので、背景伝搬パタンレジスタの第15列目の値は
「2」とされる。
以下、文字塊パタンデータの第3ライン目以後の各画
素についても上述したと同様な検定を行ない、よって、
文字塊パタンデータの第1ライン目から該文字塊パタン
データに外接する枠の下辺(第2図(B)に55bで示
す)までの、第6図に示すような背景伝搬パタンデータ
を得る。背景伝搬パタン作成部205は、作成した背景伝
搬パタンデータを切り出しアドレス検出部207に出力す
る。
次に、切り出しアドレス検出部207は、先ず、背景伝
搬パタンデータの下辺(第6図の例であれば第17ライン
目)の各データを走査し値が1から1以外の値(2〜4
のいずれかの値)に変化する画素を検出する。第6図の
例の場合は、第14列目の画素値が1であり第15列目の画
素値が4であるので、切り出しアドレス検出部207は、
第15列目の画素を検出する。この画素は、オーバーラッ
プ文字「eX」の「e」及び「X」間の下辺方向から見て
第1の間隙画素ということになる。従って、切り出しア
ドレス検出部207は、この第1の間隙画素の座標を切り
出しアドレスの1つとして記憶する。続いて、切り出し
アドレス検出部207は、この第1の間隙画素の座標(こ
の例ではライン方向の位置座標yi=17、列方向の位置座
標xi=15)と、該画素の値(この例では4)とを下記の
(2)式に代入し第16のライン上での間隙画素即ち第2
の間隙画素の位置座標を算出する。
但し、(2)式中において、 xi+1は、次の間隙画素の列方向の位置座標、 yi+1は、次の間隙画素の列方向と直交する方向(ライン
方向)の位置座標、 xiは、現間隙画素の列方向の位置座標、 yiは、現間隙画素のライン方向の位置座標、 Aは、現間隙画素の背景伝搬方向を示す値をそれぞれ
示す。
以下、この第2の間隙画素の位置座標及び値Aから第
15ライン上の間隙画素(第3の間隙画素)の位置座標を
算出し、この第3の間隙画素の位置座標及び値から第14
ライン上の間隙画素(第4の間隙画素)の位置座標を算
出するというようにして、第1ライン目までの間隙画素
の座標を(2)式に従い順次算出してゆく。このように
して算出した各間隙画素の位置座標が切り出しアドレス
ということになる。切り出しアドレス検出部207は、こ
のように算出した切り出しアドレスを文字切り出し部20
9に出力する。この実施例の場合の切り出し対象文字列
「eX」の切り出しアドレスデータの一覧を第2表に示し
た。また、この切り出しアドレスデータに従い設定され
る切り出し線83を第7図に示した。
次に、文字切り出し部211は、文字判定部203から入力
されている文字塊パタンデータについて、切り出しアド
レス検出部207より入力された切り出しアドレスデータ
に基づき分割し、1文字分づつの文字パタンデータを作
成し、順次パタンレジスタ100cに出力する。この実施例
の場合の切り出し対象文字列「eX」の切り出し結果であ
る「e」の文字パタンデータ85aを第8図(A)に、
「X」の文字パタンデータ85bを第8図(B)にそれぞ
れ示した。
パタンレジスタ100cは、字数判定部203又は文字切り
出し部209より入力された文字パタンデータをその2次
元座標が再現出来る形式で記憶する。この実施例では、
パタンレジスタ100cは128×128画素の容量を有するメモ
リで構成してある。
認識部100dは、パタンレジスタ100cに記憶されている
文字パタンデータを読み取り、これの特徴を所定の方法
により抽出して特徴マトリクスを作成する。さらに、こ
の特徴マトリクスと、予め用意されている標準文字パタ
ンの辞書マトリクスとの類似度を算出し最も類似度の大
きい辞書マトリクスの文字名を文字名出力として文字名
出力端子100dに出力する。
なお、文字パタンデータからの特徴の抽出は、従来公
知の種々の方法により行なうことが出来るが、この実施
例の場合以下に説明するような方法で行なった。
先ず、文字パタンデータについてその文字線部に外接
する例えば矩形の枠を検出する。
次に、この文字パタンの線幅WMを下記(3)式で示さ
れる周知の近似式を用いて算出する。
WM=1/(1−Q/A)…(3) ここで(3)式において、Qは、文字パタンを2×2
ビットの窓からのぞいた場合この窓内の4画素全てが黒
ビットとなる窓の数であり、Aは、文字パタン中の全黒
ビットの個数である。
次に、この文字パタンを複数の方向に走査を行なって
各走査列毎の黒ビットの連続個数を検出し、この黒ビッ
トの連続個数と、上述の線幅WMとに基づいて上述の複数
の方向毎に対応したサブパターンをそれぞれ抽出する。
そして、この文字パタンの上述の外接枠内を各サブパタ
ンについて(N×M)個の領域にそれぞれ分割し、さら
に各分割領域内の文字線を表わす特徴量を各分割領域毎
に計算し、この特徴量を文字枠の大きさで正規化して特
徴マトリクスを得る。この実施例では、特徴量を(ΔX
+ΔY)/2なる値で除することによって正規化する。こ
こでΔXは外接枠の水平方向の長さ、ΔYは外接枠の垂
直方向の長さである。
また、このようにして求めた特徴マトリクスと、予め
用意されている標準文字パタンの辞書マトリクスとの類
似度の算出は、この実施例では、下記(4)式にて求め
ている。
但し、(4)式中、Bは類似度、fiは被認識文字の文
字パタンデータの特徴マトリクスの要素値、giは辞書マ
トリクスの要素値、N×Mは被認識文字の特徴マトリク
ス及び辞書マトリクスの次元数をそれぞれ示す。
以上がこの発明の文字切り出し装置の実施例の説明で
ある。しかし、この発明は上述の実施例にのみ限定され
るものではなく以下に説明するような種々の変更を加え
ることが出来る。
上述の実施例の背景伝搬パタン作成部207では、検定
の結果文字背景部であると判定された被検定画素につい
ての文字背景部の伝搬方向を示す値は、被検定画素が在
るラインより1ライン上の被検定画素と同列の画素及び
この画素の左右1個づつの画素合計3画素の値に基づい
て決定していた。しかし、伝搬方向の示す値の決定は、
3画素以上の画素の値例えば5画素の値に基づいて決定
しても良い。その場合、5画素の値がどのような場合に
被検定画素をどのような値とするかについては、3画素
の場合の条件に準じて定めれば良い。
また、上述の実施例では、文字塊パタンデータは2文
字の文字パタンデータがオーバーラップしたものであっ
た。しかし、3文字以上の文字パタンデータがオーバー
ラップした場合であっても、実施例と同様な処理で1文
字づつの文字パタンデータを順に切り出すことが出来
る。
また、上述の例では、文字塊切り出し部及び字数判定
部をそれぞれ設け、文字塊切り出し部によって第1の文
字切り出しをし、字数判定部でオーバーラップ文字と判
定された文字塊パタンデータについてのみ背景伝搬パタ
ンデータの作成等を行なっている。この理由は、オーバ
ーラップ文字以外の文字即ち1文字から成る文字塊パタ
ンデータは、背景伝搬パタンデータの作成等の処理をす
ることなくそのまま認識処理を実効させるためである。
しかし、文字塊切り出し部及び字数判定部を設けずに、
入力文字列データ全体に対し背景伝搬パタンデータを作
成する処理を実効しその後文字切り出しを行なっても勿
論良い。
また、上述の実施例では、背景伝搬パタンデータ作成
部は、文字塊パタンデータ及び背景伝搬パタンデータ
を、外接枠の上辺から下辺方向に走査して背景伝搬パタ
ンデータを作成し、切り出しアドレス検出部は、下辺か
ら上辺に向って文字背景部を追跡して切り出しアドレス
を検出していた。しかし、背景伝搬パタンデータ作成部
は、文字塊パタンデータ及び背景伝搬パタンデータを、
外接枠の下辺から上辺方向に走査して背景伝搬パタンデ
ータを作成するようなものとし、切り出しアドレス検出
部は、上辺から下辺に向って文字背景部を追跡して切り
出しアドレスを検出するようなものとしても勿論良い。
また、上述の実施例では、文字塊パタンデータの切り
出し入力文字列データの黒ビットのヒストグラムを用い
行ない、字数判定を文字塊パタンデータの文字線部に外
接する枠の縦横比に基づき行なっている。しかし、これ
らの処理はこの例に限られるものではなく、他の好適な
方法でも勿論良い。
(発明の効果) 上述した説明からも明らかなように、この発明の文字
切り出し装置にられば、入力文字列データの外接枠の一
方の辺上における文字背景部を意味する白ビットの他方
の辺までの連なり具合を検出する。さらに他方の辺上の
白ビットを始点として一方の辺方向に文字背景部を追跡
してゆくことにより、文字間の間隙を検出し、この文字
間間隔に基づいて文字切り出しが出来る。
従って、切り出し対象文字列がオーバーラップ文字で
あっても、1文字づつの文字パタンデータを正確に切り
出すことが出来る。さらに、入力文字列データを順次走
査するだけで文字背景部の連なり具合を示す背景伝搬パ
タンが得られるので、文字の輪郭等を追跡しオーバーラ
ップ文字における文字の区切りを検出するような場合よ
りも、処理が簡単である。
また、文字塊切り出し部を設けることにより入力文字
列データを小分けでき、さらに、字数判定を設けること
により、文字塊切り出し部によって切り出された文字塊
パタンデータが1文字から成るものなのかオーバーラッ
プ文字から成るものなのかの判定が出来る。従って、文
字塊パタンデータの切り出しを既知の簡単な方法で行な
っても、オーバーラップ文字についてはその後に適格な
処理が行なわれる。然も、オーバーラップ文字から成る
文字塊パタンデータについてのみ、背景伝搬パタン作成
や文字パタンデータへの分離という処理が行なわれるだ
けであるので、全体的な文字切り出し時間は非常に短く
て済む。
従って、この文字切り出し装置によれば、文字認識を
高精度かつ高速に行なえる文字認識装置を実現すること
が出来る。
【図面の簡単な説明】
第1図は、実施例の文字切り出し装置を組み込んだ文字
認識装置を示すブロック図、 第2図(A)は、切り出し対象文字列の説明に供する
図、 第2図(B)は、文字塊パタンデータの説明に供する
図、 第3図(A)〜(D)は、背景伝搬パタンデータの各画
素の値の決定法の説明に供する図、 第4図(A)〜(C)は、文字背景部の連なり方向の説
明に供する図、 第5図(A)及び(B)は、背景伝搬パタン作成部の説
明に供する図、 第6図は、背景伝搬パタンデータの説明に供する図、 第7図は、切り出しアドレス検出部の説明に供する図、 第8図(A)及び(B)そは、文字切り出し部の説明に
供する図、 第9図は、従来技術の説明に供する図である。 100……文字認識装置、100a……光信号 100b……前処理部、100x……光電変換部 100y……ラインバッファ、100c……パタンレジスタ 100d……認識部、100e……文字名出力端子 200……文字切り出し装置 201……文字塊切り出し部 203……字数判定部、205……背景伝搬パタン作成部 207……切り出しアドレス検出部 209……文字切り出し部 51……帳票(媒体)、53……入力文字列 53a……オーバーラップ部分 55……文字線部に外接する枠 55a……上辺、55b……下辺 W……外接枠の幅、H……外接枠の高さ 1……黒ビット、O……白ビット 61……被検定画素に対応するメモリ内の値 63……被検定画素のラインより1ライン上の同列の画素
に対応するメモリ内の値 65a,65b……左右の画素に対応するメモリ内の値 P……文字背景部の連なり方向 71……列番号 72……仮想した第Oライン目の背景伝搬パタンデータ 73……文字塊パタンデータの第1ライン目のデータ 74……背景伝搬パタンデータの第1ライン目のデータ 75……文字塊パタンデータの第2ライン目のデータ 76……背景伝搬パタンデータの第2ライン目のデータ 81……背景伝搬パタンデータ 83……切り出し線、85a,85b……文字パタンデータ。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭62−123582(JP,A) 特開 平1−137385(JP,A) 特公 昭62−46039(JP,B2) (58)調査した分野(Int.Cl.6,DB名) G06K 9/34

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】媒体上の文字列からの光を光電変換し量子
    化された入力文字列データを得、該入力文字列データよ
    り1文字分づつの文字パタンデータを切り出す文字切り
    出し装置において、 (イ)入力文字列データの一部又は全部に外接する四角
    形状の枠についての該入力文字列データを格納している
    メモリ上での座標を検出し、該外接枠内をこれの文字列
    方向と平行な一方の辺から他方の辺に向って前記文字列
    方向を主走査方向として順次に走査することにより、前
    記一方の辺から前記他方の辺までの文字背景部の連なり
    方を表す背景伝搬パタンデータを作成する背景伝搬パタ
    ン作成部と、 (ロ)前記作成された背景伝搬パタンデータにおける前
    記他方の辺上の文字背景部を検出し、該文字背景部に基
    づいて前記入力文字列データの前記外接枠内の部分に含
    まれる文字間の間隙を検出する切り出しアドレス検出部
    と、 (ハ)前記検出された切り出しアドレスに基づいて前記
    入力文字列データの前記外接枠内の部分から文字パタン
    データを切り出す文字切り出し部と を具えたことを特徴とする文字切り出し装置。
  2. 【請求項2】請求項1に記載の文字切り出し装置におい
    て、 入力文字列データより文字塊パタンデータを切り出す文
    字塊切り出し部と、 該文字塊パタンデータ内に含まれる文字パタン数を判定
    すると共に、文字パタン数が1と判定された場合は前記
    文字塊パタンデータを文字パタンデータとしてそのまま
    出力し、文字パタン数が2以上と判定された場合は前記
    文字塊パタンデータを前記背景伝搬パタン作成部及び文
    字切り出し部に対し出力する字数判定部と を具えたことを特徴とする文字切り出し装置。
  3. 【請求項3】請求項1又は2に記載の文字切り出し装置
    において、 前記背景伝搬パタン作成部を、 (a)前記走査において各画素につき該画素が文字線部
    であるか文字背景部であるかを検定し、 (b)被検定画素が文字線部である場合はメモリの該被
    検定画素に対応するアドレスに第1の所定値を格納し、 (c)被検定画素が文字背景部である場合で該被検定画
    素が含まれる走査線の直前の走査線上の該被検定画素近
    傍の複数の画素のうちの少なくとも1つの画素に対し該
    直前の走査線よりさらに1本直前の走査線から文字背景
    部が連なっている場合には、該被検定画素に文字背景部
    が連なっていると認定すると共に、前記少なくとも1つ
    の画素が前記複数の画素の中のどの位置に在るかに応じ
    て予め定めてある所定値を前記メモリの該被検定画素に
    対応するアドレスに格納し、及び (d)被検定画素が文字背景部である場合で該被検定画
    素が含まれる走査線の直前の走査線上の該被検定画素近
    傍の複数の画素のいずれも該直前の走査線よりさらに1
    本直前の走査線から文字背景部が連なっていない場合に
    は、前記メモリの該被検定画素に対応するアドレスに前
    記第1の所定値を格納する 背景伝搬パタン作成部としたこと を特徴とする文字切り出し装置。
  4. 【請求項4】請求項3に記載の文字切り出し装置におい
    て、 前記複数の画素を、前記被検定画素に対し前記直前の走
    査線上で同列の位置に在る画素及び該画素の左右にある
    1個づつの画素の合計3画素としたことを特徴とする文
    字切り出し装置。
  5. 【請求項5】請求項1に記載の文字切り出し装置におい
    て、 前記切り出しアドレス検出部を、 前記他方の辺上で検出された文字背景部を始点とし前記
    背景伝搬パタン中の前記一方の辺に向って連なっている
    文字背景部を順次に追跡しこれら文字背景部の座標を1
    文字分づつの文字パタンデータを切り出すためのアドレ
    スとする切り出しアドレス検出部としたこと を特徴とする文字切り出し装置。
JP1231037A 1989-09-06 1989-09-06 文字切り出し装置 Expired - Lifetime JP2878327B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1231037A JP2878327B2 (ja) 1989-09-06 1989-09-06 文字切り出し装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1231037A JP2878327B2 (ja) 1989-09-06 1989-09-06 文字切り出し装置

Publications (2)

Publication Number Publication Date
JPH0392987A JPH0392987A (ja) 1991-04-18
JP2878327B2 true JP2878327B2 (ja) 1999-04-05

Family

ID=16917287

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1231037A Expired - Lifetime JP2878327B2 (ja) 1989-09-06 1989-09-06 文字切り出し装置

Country Status (1)

Country Link
JP (1) JP2878327B2 (ja)

Also Published As

Publication number Publication date
JPH0392987A (ja) 1991-04-18

Similar Documents

Publication Publication Date Title
US20050141766A1 (en) Method, system and program for searching area considered to be face image
CN112364834A (zh) 一种基于深度学习和图像处理的表格识别的还原方法
JPH07105312A (ja) 光学式文字読取装置における文字イメージのごみ除去方法及び装置
JP2878327B2 (ja) 文字切り出し装置
JPH0548510B2 (ja)
JP2788506B2 (ja) 文字認識装置
JP3095470B2 (ja) 文字認識装置
JP2722549B2 (ja) 光学文字読取装置
JP3095437B2 (ja) 文字行検出切出装置および文字読取装置
JP2590099B2 (ja) 文字読取方式
JPH0564396B2 (ja)
JP3379663B2 (ja) 文字認識装置
JPH0679348B2 (ja) 行切り出し方法
JP3341097B2 (ja) 光学文字読取装置
JPH07160810A (ja) 文字認識装置
JP3220226B2 (ja) 文字列方向判別方法
JPH02166583A (ja) 文字認識装置
JP2832035B2 (ja) 文字認識装置
JP2683116B2 (ja) 罫線の除去方法
KR930005568B1 (ko) 오 추출 라인 검출 방법
JPH0728934A (ja) 文書画像処理装置
JP2888885B2 (ja) 文字切出し装置
CN117649670A (zh) 文档版面分析模型训练方法、应用方法、计算机装置及计算机可读存储介质
JP2954218B2 (ja) 画像処理方法及び装置
JPH03217993A (ja) 文字サイズ認識装置