JPS6221155B2 - - Google Patents

Info

Publication number
JPS6221155B2
JPS6221155B2 JP56170369A JP17036981A JPS6221155B2 JP S6221155 B2 JPS6221155 B2 JP S6221155B2 JP 56170369 A JP56170369 A JP 56170369A JP 17036981 A JP17036981 A JP 17036981A JP S6221155 B2 JPS6221155 B2 JP S6221155B2
Authority
JP
Japan
Prior art keywords
character
coordinates
line
characters
processed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP56170369A
Other languages
English (en)
Other versions
JPS5872272A (ja
Inventor
Hitoshi Komatsu
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP56170369A priority Critical patent/JPS5872272A/ja
Publication of JPS5872272A publication Critical patent/JPS5872272A/ja
Publication of JPS6221155B2 publication Critical patent/JPS6221155B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 本発明は光学文字読取装置(以下「OCR」と
いう)に関し、特に帳票上の文字の切出し精度を
向上させたOCRに関する。
従来のOCRにおける文字切出しは、第1図A
に示す如く、帳票101上の文字を読み取る際
に、各文字を切出すために、例えば各行ごとに設
けられたラインマーク102を基準にして、該当
行の開始位置X座標103から1文字ずつ切出す
方法、あるいはラインマークを設けずに、帳票1
01の上辺や左辺を基準辺として各行の開始位置
X座標104、Y座標105を基に切出す方法等
によつて行われている。
ところが、実際のOCRにおいては紙送り精度
の上で、第1図Bに示す如き帳票の斜め搬送
(「スキユー」と呼ばれる)が発生することが多
く、このような場合には、実際の文字枠106に
対して、見かけ上の枠107がずれるため、例え
ば文字枠106の下方に書かれているコンマ記号
108は、見かけ上の枠107の外に置かれるこ
とになり、第1文字目がスペースと誤認識されて
しまうという問題があつた。
この問題に対して従来とられて来た対策は、実
際の枠の高さより文字取り込みの範囲を大きくす
るというものである。すなわち、第2図Aに示す
如く、実際の文字枠201に対して文字取り込み
領域202をそれより1まわり大きくしておくと
いうものである。これにより、実際の文字枠20
1が前記スキユー等のために予想位置より下方に
ずれたような場合でも、取り込み領域202が充
分にカバーして、文字枠201内のコンマ記号を
確実に取り込むことができる。同様のことは横方
向についても言えることである。
上述の方法で問題になるのは、上下に隣接する
文字枠行が接近した場合、すなわち、行間のクリ
アエリアが前記スキユー等によるずれ量の累積値
より小さくなる場合である。この場合には、第2
図Bに示す如く、下の行の文字取り込み領域20
3が隣接する上の行の一部をも含むことになり、
本来スペースを認識すべきところを、例えばアポ
ストロフイと誤認識してしまうという問題が発生
する。更に重要なことは、上の行で一度読んだ文
字(コンマ)と同じものが再度下の行でも読まれ
ることにより、その出力情報はOCRユーザにと
つて理解しにくいものとなり、修正に大変手間が
かかることになるという点である。なお、このよ
うな同一文字の2度読みの危険性は横方向につい
ても同様であり、ある桁で既に認識した文字を次
の桁で再び処理してしまう危険がある。
本発明は上記事情に鑑みてなされたもので、そ
の目的とするところは、従来のOCRにおける上
述の如き問題を解消し、行間・桁間が接近してい
る場合でも同一文字を2度読んでしまうような誤
読を防止したOCRを提供することにある。
本発明の上記目的は、帳票上の文字を光学的に
読取る装置において、読取り対象行を含む領域の
文字イメージを蓄える記憶部分と、切出した文字
イメージに外接する長方形の特定の頂点の前記記
憶部分におけるX、Y座標位置を、その文字桁に
対応して記憶する手段とを備え、文字を切出した
際に該文字の前記座標と既に処理された隣接行の
該当桁の文字の前記座標とを比較して、これらが
同一である場合には該文字が既に処理されたもの
として認識対象から除外することを特徴とする光
学文字読取装置によつて達成される。
以下、本発明の実施例を図面に基づいて詳細に
説明する。
第3図は帳票上の文字枠を示すもので、帳票3
01上に縦i行、横j桁の文字枠がそれぞれ等間
隔に配列されている。このように構成された帳票
から、パターンを取り込む場合を想定し、これを
メモリに格納した状態を第4図に示す。第4図
は、第3図に示した帳票301上の第i行、第j
桁の枠内で切出された文字成分(この場合、コン
マ記号)の外接長方形401の、例えば左下角の
メモリ内における座標(Xij、Yij)を決定する
状況を示すもので、こうして決定された座標(X
ij、Yij)は第i行、第j桁の文字枠のチエツク
用座標として登録しておく。この様子を第5図に
示す。
第5図に示したテーブルを基に、次行(縦方向
の場合)または次桁(横方向の場合)の対応する
枠内文字についてのチエツク用座標と、前記第i
行、第j桁のチエツク用座標とを比較して、前述
の如くこれらが一致した場合には、該次行または
次桁の対応する枠内文字を処理済みとするもので
ある。
第6図は、本発明の一実施例を示すOCRのブ
ロツク図である。図において、601は帳票、6
02はレンズ、603はセンサ、604はアン
プ、605は2値化回路、606はパターン・メ
モリ、607は1文字切出し論理である。また、
図の一点鎖線で囲まれた部分が、本実施例装置の
特徴部分であり、シフト・レジスタ608、フリ
ツプ・フロツプ609、レジスタ610,61
1、比較器612、カウンタ613、ゲート61
4、フリツプ・フロツプ615、カウンタ61
6、レジスタ617、ゲート620,621,6
22等から構成されている。
帳票601はここには図示されていない紙送り
機構により読み取りステーシヨン部に搬送され、
レンズ602を介して該帳票601上の1走査分
が順次、センサ603に投影される。該センサ6
03の出力は、アンプ604を経て2値化回路6
05により黒白2値に量子化され、パターン・メ
モリ606に2行分ずつ格納される。該パター
ン・メモリ606に格納されたパターンからは、
従来用いられていたと同様の1文字切出し論理6
07により、読み取り領域(前述の如く、実際の
文字枠より1まわり大きい)内のパターンが抽出
される。
上記1文字切出し論理607により抽出された
1文字分のパターン(複数の文字の成分を含んで
いる場合もあり得る)は、1走査分ずつシフト・
レジスタ608に送られ、ここで1ビツトずつシ
フトされ、黒成分があるとフリツプ・フロツプ6
09がセツトされる。なお、該フリツプ・フロツ
プ609は図示されていない制御論理により、1
走査の先頭でリセツトされている。
一方、1走査内の1ビツトごとに計数するカウ
ンタ613の内容は、前記フリツプ・フロツプ6
09がセツトされた時点、すなわち、黒成分が見
つかつた時点で、レジスタ611に格納される。
1走査の終了時点で、該レジスタ611の内容
は、比較器612により、前走査までの最小値、
すなわち、最も左側での黒の位置と比較され、今
回の値が前回までの値より小さい場合には今回の
値が選択されゲート620の入力となると同時
に、レジスタ610に入力・格納される。
前記フリツプ・フロツプ609の出力は、ゲー
ト614により、1走査分の終了時のタイミング
信号との論理積をとり、Dタイプ・フリツプ・フ
ロツプ615により走査ごとの位相に同期され
る。一方、1走査ごとに発生するクロツクにより
計数されているカウンタ616の出力は、上記フ
リツプ・フロツプ615の“1”から“0”の変
化、すなわち、黒を含む走査から白のみの走査へ
の変化点でレジスタ617に格納される。該レジ
スタ617の出力はゲート622の一方の入力と
なる。
更に、1文字切出し論理からは、現在処理中の
第(i+1)行、第j桁に対応する上側の文字、
すなわち第i行、第j桁の文字枠内の文字に対す
る前記チエツク用座標が読み出され、ゲート62
0によりこれと今回のX座標との論理積が、ま
た、ゲート622によりこれと今回のY座標との
論理積がとられ、両者が一致した場合のみゲート
621が“1”となり、今回、第(i+1)行、
第j桁で見つかつた成分が、第i行、第j桁で処
理済みであることを報告し、認識内容から除外す
る。
ゲート621が“1”とならない場合には新た
な成分であり、次回、すなわち、第(i+2)
行、第j桁のチエツクのために、そのX座標、Y
座標を、1文字切出し論理の該当する記憶テーブ
ル内に格納する。
上記実施例においては、帳票上の文字配列が縦
方向、横方向ともに同一である場合を例に挙げた
が、これは必ずしも必要ではなく、例えば第7図
に示す如き文字配列を有する帳票に対しても、文
字配列が縦方向、横方向で一致している範囲A
(一点鎖線で囲んだ範囲)またはB(二点鎖線で
囲んだ範囲)において、上記実施例と全く同様の
操作が可能である。
以上は縦方向、すなわち、隣接する行間での文
字の重複読み取りを防止する場合の説明である
が、横方向、すなわち、同一行内の隣接文字桁に
対しても、同様に処理を行うことにより、文字の
重複読み取りを防止することができることは言う
までもない。なお、同一行内の隣接文字桁間の重
複読み取りの防止だけを目的とする場合には、前
記パターン・メモリ606は該1行分のパター
ン・データを格納するもので良い。
以上述べた如く、本発明によれば、光学文字読
取装置において、ある行の文字枠で切出した文字
の外接長方形の特定頂点の座標を記憶しておき、
縦方向の場合は、隣接する下の行の対応する枠内
の文字、横方向の場合は、同一行の隣接する枠内
の文字処理において、該文字の外接長方形の特定
頂点の座標を、前記記憶内容と比較し、これらが
一致している場合には、該文字を認識対象から除
外するようにしたので、同一文字の重複読み取り
を完全に防止できるという顕著な効果を奏する。
【図面の簡単な説明】
第1図A,Bは従来のOCRにおける読み取り
方式を示す図、第2図A,Bは従来のOCRにお
ける読み取り領域の詳細を示す図、第3図は本発
明の適用対象である帳票を示す図、第4図は本発
明の実施例におけるメモリ内のパターンを示す
図、第5図は同チエツク用座標のテーブルを示す
図、第6図は実施例装置のブロツク図、第7図は
帳票の他の例を示す図である。 601:帳票、602:レンズ、603:セン
サ、604:アンプ、605:2値化回路、60
6:パターン・メモリ、607:1文字切出し論
理、608:シフト・レジスタ、609,61
5:フリツプ・フロツプ、610,611,61
7:レジスタ、612:比較器、613,61
6:カウンタ、614,620,621,62
2:ゲート。

Claims (1)

  1. 【特許請求の範囲】 1 帳票上の文字を光学的に読取る装置におい
    て、読取り対象行を含む領域の文字イメージを蓄
    える記憶部分と、切出した文字イメージに外接す
    る長方形の特定の頂点の前記記憶部分における
    X、Y座標位置を、その文字桁に対応して記憶す
    る手段とを備え、文字を切出した際に該文字の前
    記座標と既に処理された隣接行の該当桁の文字の
    前記座標とを比較して、これらが同一である場合
    には該文字が既に処理されたものとして認識対象
    から除外することを特徴とする光学文字読取装
    置。 2 帳票上の文字を光学的に読取る装置におい
    て、少なくとも1行分の文字イメージを蓄える記
    憶部分と、切出した文字イメージに外接する長方
    形の特定の頂点の前記記憶部分におけるX、Y座
    標位置を、その文字桁に対応して記憶する手段と
    を備え、文字を切出した際に該文字の前記座標と
    既に処理された隣接桁の文字の前記座標とを比較
    して、これらが同一である場合には該文字が既に
    処理されたものとして認識対象から除外すること
    を特徴とする光学文字読取装置。
JP56170369A 1981-10-23 1981-10-23 光学文字読取装置 Granted JPS5872272A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56170369A JPS5872272A (ja) 1981-10-23 1981-10-23 光学文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56170369A JPS5872272A (ja) 1981-10-23 1981-10-23 光学文字読取装置

Publications (2)

Publication Number Publication Date
JPS5872272A JPS5872272A (ja) 1983-04-30
JPS6221155B2 true JPS6221155B2 (ja) 1987-05-11

Family

ID=15903652

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56170369A Granted JPS5872272A (ja) 1981-10-23 1981-10-23 光学文字読取装置

Country Status (1)

Country Link
JP (1) JPS5872272A (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5644972A (en) * 1979-09-19 1981-04-24 Matsushita Electric Ind Co Ltd Type character cut-out system
JPS56121184A (en) * 1980-02-26 1981-09-22 Tokyo Keiki Co Ltd Print character cut-out device

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5644972A (en) * 1979-09-19 1981-04-24 Matsushita Electric Ind Co Ltd Type character cut-out system
JPS56121184A (en) * 1980-02-26 1981-09-22 Tokyo Keiki Co Ltd Print character cut-out device

Also Published As

Publication number Publication date
JPS5872272A (ja) 1983-04-30

Similar Documents

Publication Publication Date Title
US4408342A (en) Method for recognizing a machine encoded character
USRE36581E (en) Character reader and recognizer with a specialized editing function
US4204193A (en) Adaptive alignment for pattern recognition system
US4375654A (en) Facsimile vector data compression
JPS6159568A (ja) 文書処理装置
US4607385A (en) Character recognition apparatus
US3925760A (en) Method of and apparatus for optical character recognition, reading and reproduction
US4206442A (en) Letter segmenting apparatus for OCR comprising multi-level segmentor operable when binary segmenting fails
CA1316605C (en) Method of searching binary images to find search regions in which straight lines may be found
JP2740335B2 (ja) 自動セル属性判定機能を有する表読取装置
JPS6221155B2 (ja)
JPS62553B2 (ja)
JPH0516632B2 (ja)
JPH0433074B2 (ja)
JP2784004B2 (ja) 文字認識装置
JPH0661112B2 (ja) パタ−ン認識方式
JPS62290984A (ja) パタ−ン情報入力用紙、及び、該用紙を用いたパタ−ン情報認識方法
JPS6010671B2 (ja) パタ−ン読取装置
JPH04311283A (ja) 行方向判定装置
JPS58149574A (ja) 標準パタ−ン登録装置
JPS5856079A (ja) 光学文字読取装置における文字切出装置
JPH05128309A (ja) 文字認識におけるエツジ検出方法
JPS5914080A (ja) スキユ−検出方式
JPS6249482A (ja) 画像前処理装置
JPS60179887A (ja) 文字読取装置