JPS60254382A - 文字行検出方式 - Google Patents

文字行検出方式

Info

Publication number
JPS60254382A
JPS60254382A JP59111883A JP11188384A JPS60254382A JP S60254382 A JPS60254382 A JP S60254382A JP 59111883 A JP59111883 A JP 59111883A JP 11188384 A JP11188384 A JP 11188384A JP S60254382 A JPS60254382 A JP S60254382A
Authority
JP
Japan
Prior art keywords
character
character line
detected
scanning
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59111883A
Other languages
English (en)
Inventor
Katsuhiko Furuya
古屋 勝彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP59111883A priority Critical patent/JPS60254382A/ja
Publication of JPS60254382A publication Critical patent/JPS60254382A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の技術分野] 本発明は、特に光学的文字読取装置で用いられる文字行
検出方式に関する。
[発明の技術的背景とその問題点] 従来、光学的文字読取装置(OCR>では、帳票等に記
録された文字情報を読取る場合、読取行の位置は予め記
憶されたフォーマットコントロール情報(以下FC情報
と称す)により指示される。
この場合、上記読取行の位置情報は、通常帳票の基準辺
からの距離に基づいて設定されている。
このような従来の方式では、帳票の裁断精度が低い場合
、正確な読取行位置の検出が不可能となる。このため、
最悪の場合には、OCRは文字行を検出することができ
ず、文字読取が不可能となる問題点がある。このような
問題点を解決するためには、OCRは、各種の行位置情
報を有するFC情報を予め用意し、読取対象の帳票に応
じた行位置情報を選択して帳票の文字行位置を検出する
必要がある。しかしながら、このような方式では。
FC情報が多大となり、OCRのスループットが低下す
る欠点があった。
[発明の目的] 本発明【本上記の点に鑑みてなされたもので、その目的
は、帳票の裁断精度が低い場合でも、帳票の読取文字行
を確実に検出でき、OCRのスルーブッI・を向上する
ことができる文字行検出方式を提供することにある。
[発明の概要コ 本発明では、用紙に記録された文字情報を格納したイメ
ージデータメモリに対して主走査及び副走査し、予め記
憶したFC情報に基づいて決定される文字行候補領域を
検出する候補領域検出手段が設けられる。この候補領域
検出手段により検出された文字行候補領域において、文
字行方向の複数の部分領域に対する主走査方向の各射影
データが射影データ作成手段により作成される。そして
、判定手段は、射影データ作成手段により作成された各
射影データを走査し、文字に対応する黒ブロックの存在
する位置を検出してその各黒ブロックが上記各部分領域
でほぼ同一位置に存在する際の上記黒ブロックを文字行
として決定する。
このような構成により、帳票の基準辺に依存することな
く、帳票に記録された読取文字行を確実に検出すること
ができる。
[発明の実施例] 以下図面を参照して本発明の一実施例を説明する。第1
図は一実施例に係わるOCRの構成を示すブロック図で
ある。第1図において、イメージメモリ10は、帳票に
記録された文字情報を光電変換して得られるイメージデ
ータを格納する。ラインメモリ11は、イメージメモリ
10から出力される一行分のイメージデータを格納する
。認識部12は、ラインメモ1J11から出力される一
文字毎のイメージデータに対する認識処理を行なう。制
御部13は、通常マイクロプロセッサから構成されてお
り、OCR全体の制御を行なう。この制御部13は、予
め記憶−したプログラムに基づいて、イメージメモリ1
0内を走査して読取文字行を検出する動作を行なう。さ
らに、制御部13は、認識部12から送られるl!!識
結果をコンピュータ等の外部装置へ出力する。
上記のような構成のOCRにおいて、一実施例に係わる
動作を第3図のフローチャートを参照して説明する。先
ず、帳票に記録された一連の文字情報が光電変換された
後、2値化信号のイメージデータとしてイメージメモリ
10に格納される。これにより、イメージメモリ10に
は、例えば第2図(a)に示すような帳票の1シ一ト分
のイメージデータが格納される。制御部13は、予め記
憶したFC情報に基づいて、イメージメモリ10内を走
査して読取文字行の候補領域を検出する。このとき、候
補領域は通常の読取領域より相当広く設定される(例え
ば4倍)。また、制御部13がイメージメモリ10内を
走査する際、文字列方向(矢印20)を主走査方向とし
、文字行方向(矢印21)を副走査方向とする。
次に、制御部13は、第3図のステップS1に示すよう
に上記候補領域に対応するイメージメモリ10内を走査
して、文字行方向の射影データD1〜D4を作成する。
この場合、射影データD1〜D4は、上記候補領域に対
し所定の間隔を以て副走査して得られる各部分領域22
a〜22dに対応する射影データである。この部分領域
228〜22dは、文字行の長さにより予め決定される
。制御部13は、第2図(b)に示すような射影データ
D1〜D4を内臓する射影メモリ23に格納する。
制御部13は、射影データD1〜D4を走査し、文字行
として可能性のある各部分領域22a〜22dの黒ビツ
トブロックを検出する。即ち、制御部13は、例えば射
影データD1〜D4を走査して、文字の高さ程度に対応
する連続した黒ブロック及びそのブロックの上下に白ブ
ロックが存在するか否かを判定する。この判定結果によ
り、黒ブロック及び白ブロックが存在すれば、制御部1
3はその黒ブロックの位置を文字行候補位置として記憶
する(ステップ82.83>。同様に、他の射影データ
D2〜D4を走査して、黒ブロックの文字行候補位置を
検出して記憶する(ステップ84.85)。このとき、
1個の部分領域で複数の文字行候補位置を検出してもよ
い。
次に、制御部13は、検出した各文字行候補位置の連続
性を検証する(ステップ86)。即ち、各文字行候補位
置が、部分領域22a〜22dに渡ってほぼ同一位置に
存在するか否かを検証する。この検証結果により、各候
補位置が連続していれば、その候補位置である黒ブロッ
クの位置を読取文字行の位置として検出することになる
(ステップS7)。そして、制御部13は、上記のよう
にして検出した文字行位置を読取位置として決定し、予
め記憶したFC情報の文字行位置を検出した文字行位置
に変更する(ステップ88)。この文字行位置情報に基
づいて、制御部13は、イメージメモリ10から読取対
象である1行分のイメージデータをラインメモリ11に
転送させる。さらに、ラインメモリ11から1文字毎の
検出切出し処理を行なって、1文字分のイメージデータ
を88部−12に出力させる。これにより、認識部12
では認識処理がなされ、認識結果は制御部13により外
部装置に送られる。
ここで、上記のような文字行位置の検出処理の際に、1
個の領域で複数の黒ブロックが存在する場合(射影デー
タD3.[)4)には、例えば各黒ブロックの上下領域
において、印字のクリアエリア24が存在する否か等の
条件で決定される。また、黒ブロックが1個しか検出さ
れない場合、その黒ブロックの位置が文字行位置として
決定される。
このようにして、イメージメモリ10内を走査して得ら
れる射影データを利用することにより、読取文字行の位
置を確実に検出することができる。
したがって、帳票の基準辺の位置情報を用いることなく
、読取文字行の位置を検出できる。このため、帳票の裁
断精度が悪化した場合でも、帳票に記録された文字行の
位置を確実に検出することができる。
[発明の効果] 以上詳述したように本発明によれば、帳票の裁断精度が
低い場合でも、帳票に記録された読取文字行の位置を確
実に検出することができる。したがって、本発明をOC
Rに適用すれば、裁断精度が異なる各種の帳票に記録さ
れた文字読取処理を実行でき、結果的にOCRのスルー
プットを大幅に向上できるものである。
【図面の簡単な説明】
M1図は本発明の一実施例に係わるOCRの構成を示す
ブロック図、第2図(a)、(b)はそれぞれ第1図の
OCRの動作を説明するための図で同図(a)はイメー
ジメモリの記憶内容を示す図、同図(b)は射影データ
の一例を示す図、第3図は第1図の制御部の動作を説明
するためのフローチャートである。 10・・・イメージメモリ、11・・・ラインメモリ、
12・・・認識部、13・・・制御部。 出願人代理人 弁理士 鈴江武彦 第1図 第2図

Claims (1)

    【特許請求の範囲】
  1. 用紙に記録された文字情報を光電変換して得られるイメ
    ージデータを格納するイメージデータメモリと、文字列
    方向の走査を主走査及び文字行方向の走査を副走査とし
    た場合上記イメージデータメモリ内を主走査及び副走査
    し予め記憶したFC情報に基づいて決定される文字行候
    補領域を検出する候補領域検出手段と、この候補領域検
    出手段により検出された文字行候補領域において所定の
    間隔を以て得られる文字行方向の複数の部分領域に対す
    る副走査方向−の各射影データを作成する射影データ作
    成手段と、この射影データ作成手段により作成された各
    射影データを走査し文字に対応する黒ブロックの存在す
    る位置を検出してその各黒ブロックが上記各部分領域で
    ほぼ同一位置に存在する際の上記黒ブロックを文字行と
    して決定する判定手段とから成ることを特・黴とする文
    字行検出方式。
JP59111883A 1984-05-31 1984-05-31 文字行検出方式 Pending JPS60254382A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59111883A JPS60254382A (ja) 1984-05-31 1984-05-31 文字行検出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59111883A JPS60254382A (ja) 1984-05-31 1984-05-31 文字行検出方式

Publications (1)

Publication Number Publication Date
JPS60254382A true JPS60254382A (ja) 1985-12-16

Family

ID=14572537

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59111883A Pending JPS60254382A (ja) 1984-05-31 1984-05-31 文字行検出方式

Country Status (1)

Country Link
JP (1) JPS60254382A (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5866174A (ja) * 1981-10-15 1983-04-20 Ricoh Co Ltd 行抽出方法
JPS58106665A (ja) * 1981-12-18 1983-06-25 Ricoh Co Ltd 文字行切出し方法
JPS58146973A (ja) * 1982-02-25 1983-09-01 Ricoh Co Ltd 文字行および文字の切出し方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5866174A (ja) * 1981-10-15 1983-04-20 Ricoh Co Ltd 行抽出方法
JPS58106665A (ja) * 1981-12-18 1983-06-25 Ricoh Co Ltd 文字行切出し方法
JPS58146973A (ja) * 1982-02-25 1983-09-01 Ricoh Co Ltd 文字行および文字の切出し方法

Similar Documents

Publication Publication Date Title
EP0125877B1 (en) Information input apparatus
US5233672A (en) Character reader and recognizer with a specialized editing function
JPH0147828B2 (ja)
JPS60254382A (ja) 文字行検出方式
JPS5824265A (ja) フアクシミリ送信機を用いたマ−ク読取方式
JPS642313B2 (ja)
JPS6033332B2 (ja) フアクシミリを用いた情報入力方式
JPH07230525A (ja) 罫線認識方法及び表処理方法
JP3240273B2 (ja) 帳票読み取り装置
JPH08305791A (ja) 画像認識装置及び制御シート
JPH0373916B2 (ja)
JP3160458B2 (ja) 文字読取装置及び文字読取方法
JP2506142B2 (ja) 文字読取り装置
JPH0744682A (ja) 画像読取装置
JP2994985B2 (ja) 文字認識方法及び文字認識装置
JPH0782524B2 (ja) 光学的文字読取装置
JP2731173B2 (ja) 光学的文字読取装置
JP2706086B2 (ja) 文字認識装置
JPH11250179A (ja) 文字認識装置および文字認識方法
JP3334369B2 (ja) 選択項目認識装置
JPH11161739A (ja) 文字認識装置
JPH05314311A (ja) 光学式文字読取装置
JP2001030580A (ja) 画像処理装置、印刷制御方法、及び記憶媒体
JPH04344585A (ja) 光学式文字読取装置
JPS6362940B2 (ja)