JPS6045884A - 文字認識装置の文字枠除去装置 - Google Patents
文字認識装置の文字枠除去装置Info
- Publication number
- JPS6045884A JPS6045884A JP58154695A JP15469583A JPS6045884A JP S6045884 A JPS6045884 A JP S6045884A JP 58154695 A JP58154695 A JP 58154695A JP 15469583 A JP15469583 A JP 15469583A JP S6045884 A JPS6045884 A JP S6045884A
- Authority
- JP
- Japan
- Prior art keywords
- character
- character frame
- image distribution
- characters
- written
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Input (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(A)発明の技術分野
本発明は、文字認識装置に係り、特にドロップj′パノ
1−カラーで書かれていない文字枠を有する帳票を読取
り帳票として用いる場合に文字枠の除去を行なう文字枠
除去装置に関するものである。
1−カラーで書かれていない文字枠を有する帳票を読取
り帳票として用いる場合に文字枠の除去を行なう文字枠
除去装置に関するものである。
(B)従来技術と問題点
従来、文字認識装置においては、ドロップアウトカラー
で印刷された文字枠を有する帳票を用い、読取りに際し
ては、ドロップアウトカラー内に記入された文字、記号
のめを読取るようにしている。
で印刷された文字枠を有する帳票を用い、読取りに際し
ては、ドロップアウトカラー内に記入された文字、記号
のめを読取るようにしている。
しかしながら、この文字枠をトロツブアウトカラーで印
刷するにば、技術的Gこかなり芦しく、帳票の価格が高
くなり、ランニングコスI・がかさむという問題力くあ
っ六−0 (C)発明の目的 本発明の目的は、前述した欠点に鑑の、文字枠がトロツ
ブアウトカラーで印刷されていない帳票であっても文字
枠内に記入された文字、記号等を読取り可能にする文字
認識装置を提供することにある。
刷するにば、技術的Gこかなり芦しく、帳票の価格が高
くなり、ランニングコスI・がかさむという問題力くあ
っ六−0 (C)発明の目的 本発明の目的は、前述した欠点に鑑の、文字枠がトロツ
ブアウトカラーで印刷されていない帳票であっても文字
枠内に記入された文字、記号等を読取り可能にする文字
認識装置を提供することにある。
(D)発明の構成
そして、この目的は文字枠が陥かれた帳票と。
前記帳票を読取る手段と、前記読取手段により得られた
読取画像に基いて文字枠内に記入された文字、記号を認
識する認識手段とを備えた文字認識装置であって、前記
読取画像を直交する2方向に投影して画像分布を抽出す
る3手段と、前記抽出された画像分布に基づいて前記帳
票上に書かれた文字枠を検出する手段と、前記検出され
た文字枠を除去する手段とを備えてなることを特徴とす
る文字認識装置の文字枠除去装置を提供することにより
達成される。
読取画像に基いて文字枠内に記入された文字、記号を認
識する認識手段とを備えた文字認識装置であって、前記
読取画像を直交する2方向に投影して画像分布を抽出す
る3手段と、前記抽出された画像分布に基づいて前記帳
票上に書かれた文字枠を検出する手段と、前記検出され
た文字枠を除去する手段とを備えてなることを特徴とす
る文字認識装置の文字枠除去装置を提供することにより
達成される。
(E)発明の実施例
以下、本発明にかかる文字認識装置の文字枠除去装置を
図面を用いて詳細に説明する。
図面を用いて詳細に説明する。
第1図は帳票1の構成を説明するだめの図であって、2
−1及至2−5はドロップアウトカラーで印刷されてい
ない文字枠、3は仮想文字枠であって、文字枠2より記
入される文字がはみ出ることを考貫、して設けたもので
ある。
−1及至2−5はドロップアウトカラーで印刷されてい
ない文字枠、3は仮想文字枠であって、文字枠2より記
入される文字がはみ出ることを考貫、して設けたもので
ある。
第2図(a)は、第1図に示す帳票に文字を記入した例
を示す図、同図(b)は、同図(a)に示される記入文
字例のX方向の画像分布を示す図、同図(c)は、Y方
向の画像分布を示す図である。
を示す図、同図(b)は、同図(a)に示される記入文
字例のX方向の画像分布を示す図、同図(c)は、Y方
向の画像分布を示す図である。
ここで、画像分布とは、帳票1唆第1図図示のX、Y方
向に走査して得られた、黒、白の2値画像信号のうちの
各走査線毎の黒画像信号の数を示すグラフである。
向に走査して得られた、黒、白の2値画像信号のうちの
各走査線毎の黒画像信号の数を示すグラフである。
本発明は、この画像分布と、帳票読取りの1際に予め定
められでいるフォーマット情!■、例えば帳票上に文字
が幾つ書かれている1文字枠の大きさ。
められでいるフォーマット情!■、例えば帳票上に文字
が幾つ書かれている1文字枠の大きさ。
文字枠と文字枠の間隔等(これらは文字枠がドロソブア
ウ1−カラーで印刷された帳票を用いるときに予めわか
っている情報である)を用いて、文字枠を除去するよう
にしたものである。
ウ1−カラーで印刷された帳票を用いるときに予めわか
っている情報である)を用いて、文字枠を除去するよう
にしたものである。
まず、第2図に示す画像分布で次の条件を満たす領域を
める。
める。
Y方向において、画像分布の高さ11がh≧t hl
−−−−−(i ) X方向において、画像分布の高さhが h (j+1)−h (j)≧t J 〜−−(ii
)但し、Jば位置を示ず添字、ttz 、th−Lは闇
値を示す。
−−−−−(i ) X方向において、画像分布の高さhが h (j+1)−h (j)≧t J 〜−−(ii
)但し、Jば位置を示ず添字、ttz 、th−Lは闇
値を示す。
この領域を第2図中記号ア〜すで示した。ここで、記号
ア〜すで示す領域は、ザンプリング位置が多い場合、領
域中で凹んだ形となるが、説明の都合」−凸形状である
ものとする。これらの領域は文字枠存在の候補域である
。次に候補域より真の文字枠域とその幅をめる手順につ
いて述べる。
ア〜すで示す領域は、ザンプリング位置が多い場合、領
域中で凹んだ形となるが、説明の都合」−凸形状である
ものとする。これらの領域は文字枠存在の候補域である
。次に候補域より真の文字枠域とその幅をめる手順につ
いて述べる。
これらをめるために、次のような通常前もってわかって
いるフォーマット情報を用いる。
いるフォーマット情報を用いる。
(1)仮碧、文字枠
(2)1行の文字数(N文字)
(3)文字枠の大きさくa:Y方向の長さ、b二方向の
長) これらを用いて文字枠を検出する方法について説明する
。
長) これらを用いて文字枠を検出する方法について説明する
。
(I)Y方向文字枠の検出
もし、あらゆる誤差が生じないと仮定すれば文字枠部分
の画像分布の値は文字数NXX方向の長さ1)となり、
その間隔はY方向の長さaに近い値となる。
の画像分布の値は文字数NXX方向の長さ1)となり、
その間隔はY方向の長さaに近い値となる。
そこで、図中記号ア、イの部分が、(i)同一の仮想文
字枠3内に存在し、(ii)その周辺分布値1)ア、h
イがlhアーNbI<k、1hイーNb1〈k(kは誤
差を考慮した闇値)であり、 (iii )記号ア、イ
の距離dがd嬌aであるとき記号ア、イの部分が文字枠
分の投影部であると決定できる。
字枠3内に存在し、(ii)その周辺分布値1)ア、h
イがlhアーNbI<k、1hイーNb1〈k(kは誤
差を考慮した闇値)であり、 (iii )記号ア、イ
の距離dがd嬌aであるとき記号ア、イの部分が文字枠
分の投影部であると決定できる。
(II) X方向文字枠の検出
仮想文字枠3と文字数Nによって記号つ〜ザの候補域を
分けると、夫々(つ、工、オ)、にh。
分けると、夫々(つ、工、オ)、にh。
キ)、(り、ケ、コ、ザ)の部分に分けられる。
各部分て2つづつ選ぶ組合せ牽選び(例えば(つ、工、
オ)の部分では(つ、工、)(つ、オ)(工2オ)の3
通りがある。゛) それらのうち距離dが最もbに近き、かつ画像分布値が
1hi−al<J であるものをめる。
オ)の部分では(つ、工、)(つ、オ)(工2オ)の3
通りがある。゛) それらのうち距離dが最もbに近き、かつ画像分布値が
1hi−al<J であるものをめる。
こうして第1図の例では(つ、オ)(力、キ)(り、す
)か文字枠部分の投影であると決定される。
)か文字枠部分の投影であると決定される。
また、以上のように決定されたア、イ、つ、オ。
力、キ、り、すの幅の平均をめることにより文字枠幅が
安定に検出できる。
安定に検出できる。
文字枠位置およびその幅を知ることによって、文字枠の
除去を行なえば後の処理はトロ、プアウトカラー使用の
際と同様に行なうことが可能となる。
除去を行なえば後の処理はトロ、プアウトカラー使用の
際と同様に行なうことが可能となる。
第3図は、文字認識装置の文字枠除去装置を説明するだ
めのブロック図である。
めのブロック図である。
図において、4は帳票の読取りを行なう読取り部、5は
読取り部4のからの帳票の読取り信号に対して帳票の垂
直、X方向の投影を行ない、各位置における画像分布値
をめる画像分布計算部。
読取り部4のからの帳票の読取り信号に対して帳票の垂
直、X方向の投影を行ない、各位置における画像分布値
をめる画像分布計算部。
7ば読取り帳票のフォーマット情報(記入文字数。
文字枠の大きさ1文字枠間の距離等)が格納されるフォ
ーマント情報格納部、6は画像分布計算部5からの帳票
の画像分布値とフォーマット情報とにノ占いて前jホし
たX方向、Y方向の文字枠の検出を行なう文字枠検出部
、8は文字枠検出部6によって検111されたX方向、
Y方向の文字枠情報に基いて、帳票の読取り信号の内、
文字枠部分を除去する文字枠除去部、9は文字枠除去部
8により文字枠が除去された帳票上に記入された文字の
認識を行なう認識部である。尚、認識部9はフォーマッ
ト情報格納部7よりの帳票上のどの位置にはカナのみ、
あるいは英数字混在といった情報に基いて認識処理を行
なうことにより認識精度を向上させている。
ーマント情報格納部、6は画像分布計算部5からの帳票
の画像分布値とフォーマット情報とにノ占いて前jホし
たX方向、Y方向の文字枠の検出を行なう文字枠検出部
、8は文字枠検出部6によって検111されたX方向、
Y方向の文字枠情報に基いて、帳票の読取り信号の内、
文字枠部分を除去する文字枠除去部、9は文字枠除去部
8により文字枠が除去された帳票上に記入された文字の
認識を行なう認識部である。尚、認識部9はフォーマッ
ト情報格納部7よりの帳票上のどの位置にはカナのみ、
あるいは英数字混在といった情報に基いて認識処理を行
なうことにより認識精度を向上させている。
(F)発明の詳細
な説明したように、本発明によれば、文字枠がドロップ
7ウトカラーで印刷されていない帳票であっても文字枠
内に記入された文字、記号等のみを読取ることができる
ので、ランニングコストを低減することができる。
7ウトカラーで印刷されていない帳票であっても文字枠
内に記入された文字、記号等のみを読取ることができる
ので、ランニングコストを低減することができる。
第1図は帳票の説明図、第2しIは帳票に文字を記入し
た例を示す図、第3図は文字認識装置の文字枠除去装置
を説明する図である。 図において、lは帳票、2ば文字枠、3は仮想文字枠、
4は読取部、5は画像分布計算部、6は文字枠検出部、
7はフォーマット情報格納部、8は文字枠除去部、9は
認識部である。 1′−ヤ
た例を示す図、第3図は文字認識装置の文字枠除去装置
を説明する図である。 図において、lは帳票、2ば文字枠、3は仮想文字枠、
4は読取部、5は画像分布計算部、6は文字枠検出部、
7はフォーマット情報格納部、8は文字枠除去部、9は
認識部である。 1′−ヤ
Claims (1)
- 文字枠かhWかれた帳票と、前記帳票を読取る手段と8
前記読取手段により得られた読取画像に基いて文字枠内
に記入された文字、記号を認識する認識手段とを備えた
文字認識装置であって、前記読取画像を直交する2方向
に投影して画像分布を抽出する手段と、前記抽出された
画像分布に基づいて前記帳票上に書かれた文字枠を検出
する手段と2前記検出された文字枠をl除去する手段と
を備えてなることを特徴とする文字認識装置の文字枠除
去装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58154695A JPS6045884A (ja) | 1983-08-24 | 1983-08-24 | 文字認識装置の文字枠除去装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58154695A JPS6045884A (ja) | 1983-08-24 | 1983-08-24 | 文字認識装置の文字枠除去装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS6045884A true JPS6045884A (ja) | 1985-03-12 |
Family
ID=15589920
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP58154695A Pending JPS6045884A (ja) | 1983-08-24 | 1983-08-24 | 文字認識装置の文字枠除去装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6045884A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0287125A2 (en) * | 1987-04-16 | 1988-10-19 | Fuji Photo Film Co., Ltd. | Method of processing radiation images |
-
1983
- 1983-08-24 JP JP58154695A patent/JPS6045884A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0287125A2 (en) * | 1987-04-16 | 1988-10-19 | Fuji Photo Film Co., Ltd. | Method of processing radiation images |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS63158678A (ja) | 単語間スペ−ス検出方法 | |
JP3031579B2 (ja) | 帳票の文字認識領域指定方法 | |
JPS6045884A (ja) | 文字認識装置の文字枠除去装置 | |
JPH0773271A (ja) | 領域分割方法 | |
JPH07230525A (ja) | 罫線認識方法及び表処理方法 | |
JPS62121589A (ja) | 文字切出し方法 | |
JPS6227887A (ja) | 文字種分離方式 | |
JP2000222577A (ja) | 罫線処理方法、装置および記録媒体 | |
JP2925270B2 (ja) | 文字読取装置 | |
JP3193573B2 (ja) | かぎかっこ付文字認識装置 | |
JP3160458B2 (ja) | 文字読取装置及び文字読取方法 | |
JPH1097588A (ja) | 罫線認識方法、表処理方法および記録媒体 | |
JP3334369B2 (ja) | 選択項目認識装置 | |
JPS63101983A (ja) | 文字列抽出方式 | |
JPS6224378A (ja) | 文字領域決定方式 | |
JPH07120392B2 (ja) | 文字パターン切り出し装置 | |
JPS5831028B2 (ja) | 文字認識装置 | |
JP3162575B2 (ja) | 文字認識装置 | |
JP2659182B2 (ja) | 文字認識装置 | |
JP3060237B2 (ja) | 日本語文字認識装置 | |
JPH04192090A (ja) | 光学文字読取装置 | |
JPH10233930A (ja) | 画像処理装置 | |
JPH06309499A (ja) | 帳票処理装置 | |
JPS60230282A (ja) | 文字認識装置 | |
JPS61175877A (ja) | 文字、図形切り分け装置 |