JPH0573717A - 光学的文字読取装置 - Google Patents

光学的文字読取装置

Info

Publication number
JPH0573717A
JPH0573717A JP3231243A JP23124391A JPH0573717A JP H0573717 A JPH0573717 A JP H0573717A JP 3231243 A JP3231243 A JP 3231243A JP 23124391 A JP23124391 A JP 23124391A JP H0573717 A JPH0573717 A JP H0573717A
Authority
JP
Japan
Prior art keywords
line
row
character
image
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3231243A
Other languages
English (en)
Inventor
Masao Kurita
雅郎 栗田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Computer Engineering Corp
Original Assignee
Toshiba Corp
Toshiba Computer Engineering Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Computer Engineering Corp filed Critical Toshiba Corp
Priority to JP3231243A priority Critical patent/JPH0573717A/ja
Publication of JPH0573717A publication Critical patent/JPH0573717A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【目的】帳票に対して文字行が傾いている場合であって
も、確実に行の切り出しを可能とする。 【構成】ゾーン分割部14は、ゾーンを複数のプレート
に分割する。行検出部16は、各プレートにおいて行位
置を検出する。行統合部20は、隣接するプレート間で
行位置を基に同一行の統合を行なう。さらに行統合部2
0は、統合された行の傾きから、離れたプレート間で行
の統合を行なう。1文字検切認識部26は、統合された
行が納まる範囲のイメージから文字パターンを切り出
し、認識を行なう。これにより、正確な文字認識結果を
得ることができる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、行検切り機能を備えた
光学的文字読取装置に関する。
【0002】
【従来の技術】従来、読み取りの対象とする文書の書式
が特定されないフリーフォーマット読み取りが可能な光
学的文字読取装置においては、スキャナ部において帳票
等の用紙を光学的に走査することによって検出されたイ
メージから行の切り出しを行なっている。
【0003】行の切り出しを行なう際には、スキャナ部
で帳票を搬送するときに生ずるスキュー(シートスキュ
ー)を考慮して、ゾーン(文字認識の対象とする範囲)
の中でヒストグラムをシートスキュー分を補正するよう
にとっている。
【0004】そして、このヒストグラムに基づいて行の
切り出しを行ない、さらに切り出した行について、1文
字ずつ文字を切り出している。最終的に切り出された1
文字分の文字パターンは、文字認識処理に供される。
【0005】
【発明が解決しようとする課題】このように従来の光学
的文字読取装置におけ行の切り出しは、シートスキュー
を考慮して行なわれている。このため、帳票に対して正
常に文字列が記入されていれば(例えば横書きであれば
水平)、シートスキューがあっても正確に行の切り出し
が行なわれる。
【0006】ところが、帳票に対して傾いて文字列が記
入されていると、シートスキューがなくヒストグラムを
水平にとった場合に、上または下の行とが重なってしま
うことがあった。
【0007】また、シートスキューがある場合、シート
スキューを考慮してヒストグラムをとると、帳票に対す
る行の傾きの方向によっては、さらに行の傾きを増した
状態となり、ヒストグラムがさらに上または下の行とが
重なった状態となってしまうことがあった。このため、
ヒストグラムを用いた行の切り出しができず、文字の認
識ができなかった。
【0008】本発明は前記のような点に鑑みてなされた
もので、帳票に対して文字行が傾いている場合であって
も、確実に行の切り出しが可能な光学的文字読取装置を
提供することを目的とする。
【0009】
【課題を解決するための手段】本発明は、用紙を光学的
に走査することによって検出されたイメージをもとに文
字を読取る光学的文字読取装置において、前記イメージ
中の認識対象とする範囲を所定の方向で複数の分割領域
に分割する分割手段と、前記分割手段によって得られた
各分割領域から文字が記録されている行位置を検出する
行検出手段と、前記行検出手段によって検出された各分
割領域における行位置に基づいて、分割領域間で同一の
行を統合する行統合手段と、前記行統合手段によって統
合された行の行イメージを前記イメージから切り出し、
前記行イメージを基に文字認識を行なう文字認識手段と
を具備して構成するものである。
【0010】
【作用】このような構成によれば、帳票に対して文字列
が傾いている場合であっても、複数に分割された小さな
領域(プレート)間で、それぞれの行位置に基づいて同
一行であるか否か判別することによって、各プレート間
での行位置のずれが小さくなり同一行の統合を確実に行
なうことができる。
【0011】
【実施例】以下、図面を参照して本発明の一実施例につ
いて説明する。図1は同実施例に係わる光学的文字読取
装置の構成を示すブロック図である。図1において、ス
キャナ部10は、文字読み取りの対象とする帳票につい
て、光学的走査を行ない帳票イメージを検出するもので
ある。イメージバッファ12は、スキャナ部10におい
て検出された1ページ分の帳票イメージデータを格納す
るためのものである。
【0012】ゾーン分割部12は、イメージバッファ1
2に格納された帳票イメージ中の文字認識の対象とする
範囲(ゾーン)を、例えば垂直方向で分割した領域(プ
レート)を求めるものである。行検出部16は、ゾーン
分割部14によって求められた各プレートについて、行
位置を検出するためにヒストグラムを求めるものであ
る。行情報格納部18は、行検出部16によって求めら
れたヒストグラムに関する情報を格納するためのもので
ある。行統合部20は、行情報格納部18に格納された
情報に基づいて、異なるプレート間で同一行と判別され
る行の統合を行なうものである。統合行情報格納部22
は、行統合部20によって統合された行の範囲を示すデ
ータを格納するためのものである。
【0013】ラインバッファ24は、イメージバッファ
12に格納された1ページ分の帳票イメージ中の、統合
行情報格納部22に格納されたデータが示す行の範囲に
対応するイメージデータ(行イメージ)を格納するため
のものである。
【0014】1文字検切認識部26は、ラインバッファ
24に格納された行イメージから1文字毎に文字パター
ンを切り出して認識を行ない、その結果得られた認識文
字を出力するものである。次に、同実施例の動作につい
て説明する。
【0015】まず、スキャナ部10は、文字読み取りの
対象とする帳票について光学的走査を行ない、帳票イメ
ージを検出する。ここで、検出された帳票イメージは、
イメージバッファ12に格納される。
【0016】1ページ分の帳票イメージがイメージバッ
ファ12に格納されると、ゾーン分割部14は、帳票イ
メージ中の文字認識の対象とする範囲(ゾーン)を、垂
直方向に複数のプレートに分割する。ゾーンを複数のプ
レートに分割した状態の一例を図2に示している。な
お、同実施例では、帳票に記録される文書が、図2に示
すように横書きであるものとしている。
【0017】行検出部16は、ゾーンを分割して得られ
た各プレートについて、水平方向にヒストグラムをと
る。そして、行検出部16は、ヒストグラムから行位置
を判別し、行位置を示すデータを各プレート毎に行情報
格納部18に格納する。
【0018】この行検出部16における処理を図3に示
している。行検出部16は、図3(a)に示すようなプ
レートについて、水平方向にヒストグラムをとることに
より図3(b)に示すような結果を得る。行検出部16
は、ヒストグラムから行位置を判別し、順次それぞれの
位置を示すデータ(行情報)を、図3(c)に示すよう
に行情報格納部18に格納する。
【0019】次に、行統合部20は、行情報格納部18
に格納された各プレートの行情報を比較し、同一行と判
別されるものを統合する。この行統合部20における処
理を図4乃至図6に示している。
【0020】第1に、行統合部20は、図4に示すよう
に、隣合うプレートの行のデータと比較して、行の上、
下位置がある程度以上重なったときに同一行と判別す
る。この処理を、各プレートの各行について行なう。
【0021】図4においては、第1プレートのA行と第
2プレートのC行が同一行と判別されたものとする。さ
らに、この行は、第3プレートのF行、第4プレートの
H行と同一行であると判別されたものとする。また、第
2プレートのD行と第3プレートのG行が同一行と判別
されたものとする。
【0022】第2に、行統合部20は、ゾーンにおける
行の傾きを求める。すなわち、第1の処理において同一
行と判別された行の中で最も長い行を捜し出し、その行
の傾きを求めて、ゾーンの中での行の傾きとする。
【0023】第3に、行統合部20は、第2の処理で求
めた行の傾きに基づいて、図5に示すように、離れてい
るプレート間で同一行を求める。行統合部20は、ゾー
ン内の行の傾き、あるプレートでの行位置、及び同プレ
ートと隣接しない対象とするプレートとの距離より、対
象とするプレートにおける同一行の予想点を求める。
【0024】そして、行統合部20は、予想点と対象と
するプレートでの行位置とを比較して、行の上、下位置
が重なったとき(または所定の範囲内であるとき)に同
一行と判別する。図5においては、第1プレートのB行
と、第4プレートのI行が同一行と判別され、また第2
プレートのE行と第4プレートのJ行が同一行と判別さ
れたものとする。第4に、行統合部20は、図6に示す
ように、ゾーン内の各行が納まる範囲を求めて、この範
囲を示すデータを統合行情報格納部22に格納する。
【0025】統合行情報格納部22に各行の範囲を示す
データが格納されると、このデータに応じて、イメージ
バッファ12に格納されたイメージ中からイメージを切
り出し、ラインバッファ24に1行分のイメージとして
転送される。
【0026】1文字検切認識部26は、ラインバッファ
24に格納されたイメージから1文字毎に文字パターン
を切り出し、文字認識を行なう。1文字検切認識部26
は、統合行情報格納部22に格納された各データに対応
するラインイメージについて繰り返して処理を行なう。
全ての行について文字認識を行なったら処理を終了す
る。
【0027】このようにして、帳票に記録された文字行
が傾いている場合であっても、行のイメージを統合し
て、各行毎に切り出すことができる。従って、正確な文
字認識結果を得ることができる。
【0028】なお、前記実施例においては、帳票に対し
て文字列が横書きされる場合について説明したが、縦書
きされる場合にも応用することができる。また、ゾーン
分割部14におけるゾーン分割方向も垂直方向だけでな
く水平方向であってもよい。さらに、行検出部16にお
けるヒストグラムをとる方向も縦方向であってもよい。
【0029】
【発明の効果】以上のように本発明によれば、ゾーンを
複数のプレートに分割し、各プレートにおける行位置か
らプレート間で行を統合し行イメージを切り出すので、
帳票に対する文字列の記録が傾いている場合であって
も、確実に文字列を切り出し認識を行なうことが可能と
なるものである。
【図面の簡単な説明】
【図1】本発明の一実施例に係わる光学的文字読取装置
の構成を示すブロック図。
【図2】ゾーン及びプレートを説明するための図。
【図3】行検出部16における行位置検出の処理を説明
するための図。
【図4】行統合部20において同一行を判別する処理を
説明するための図。
【図5】行統合部部20において離れているプレート間
で同一行を判別する処理を説明するための図。
【図6】統合された行の範囲を説明するための図。
【符号の説明】 10…スキャナ部、12…イメージバッファ、14…ゾ
ーン分割部、16…行検出部、18…行情報格納部、2
0…行統合部、22…統合行情報格納部、24…ライン
バッファ、26…1文字検切認識部。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 用紙を光学的に走査することによって検
    出されたイメージをもとに文字を読取る光学的文字読取
    装置において、 前記イメージ中の認識対象とする範囲を所定の方向で複
    数の分割領域に分割する分割手段と、 前記分割手段によって得られた各分割領域から文字が記
    録されている行位置を検出する行検出手段と、 前記行検出手段によって検出された各分割領域における
    行位置に基づいて、分割領域間で同一の行を統合する行
    統合手段と、 前記行統合手段によって統合された行の行イメージを前
    記イメージから切り出し、前記行イメージを基に文字認
    識を行なう文字認識手段と、 を具備したことを特徴とする光学的文字読取装置。
JP3231243A 1991-09-11 1991-09-11 光学的文字読取装置 Pending JPH0573717A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3231243A JPH0573717A (ja) 1991-09-11 1991-09-11 光学的文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3231243A JPH0573717A (ja) 1991-09-11 1991-09-11 光学的文字読取装置

Publications (1)

Publication Number Publication Date
JPH0573717A true JPH0573717A (ja) 1993-03-26

Family

ID=16920569

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3231243A Pending JPH0573717A (ja) 1991-09-11 1991-09-11 光学的文字読取装置

Country Status (1)

Country Link
JP (1) JPH0573717A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07273922A (ja) * 1994-03-30 1995-10-20 Matsushita Electric Ind Co Ltd Fax情報転送装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07273922A (ja) * 1994-03-30 1995-10-20 Matsushita Electric Ind Co Ltd Fax情報転送装置

Similar Documents

Publication Publication Date Title
US4926492A (en) Optical character reading apparatus and method
JPS6077279A (ja) 文字イメ−ジ切出し方法
JPS60262284A (ja) イメ−ジ処理方法
US4797940A (en) Optical character reader
EP0375352B1 (en) Method of searching a matrix of binary data
JPH0573717A (ja) 光学的文字読取装置
JPH011087A (ja) 行及び文字分離装置
JP4221960B2 (ja) 帳票識別装置及びその識別方法
JPH07160810A (ja) 文字認識装置
JPH06111057A (ja) 光学的文字読取装置
JPS5875278A (ja) 文字・記号認識装置
JP2975720B2 (ja) 光学的文字読取装置
JP3160458B2 (ja) 文字読取装置及び文字読取方法
JP3039427B2 (ja) 文字切り出し方式及び方法
JPS5911153B2 (ja) 光学的文字読取方式
JPH09251508A (ja) 太バー認識によるバーコード読み取り方法
JPS6343788B2 (ja)
JP2005242825A (ja) 帳票読取装置及び帳票読取装置による帳票方向判定方法
JPS6278686A (ja) 光学的文字読取装置
JPH10124610A (ja) 光学式文字読取装置
JPH08235311A (ja) 文字認識装置
JPS5936309B2 (ja) 文字読取方式
JPH0132553B2 (ja)
JPS6154575A (ja) 文字読取装置
JPH02166580A (ja) 光学的文字読取装置及び同装置の文字読取方法