JPH036552B2 - - Google Patents

Info

Publication number
JPH036552B2
JPH036552B2 JP56062226A JP6222681A JPH036552B2 JP H036552 B2 JPH036552 B2 JP H036552B2 JP 56062226 A JP56062226 A JP 56062226A JP 6222681 A JP6222681 A JP 6222681A JP H036552 B2 JPH036552 B2 JP H036552B2
Authority
JP
Japan
Prior art keywords
character
line
character pattern
unit
cutting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP56062226A
Other languages
English (en)
Other versions
JPS57176484A (en
Inventor
Takashi Akimoto
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Shibaura Electric Co Ltd filed Critical Tokyo Shibaura Electric Co Ltd
Priority to JP56062226A priority Critical patent/JPS57176484A/ja
Publication of JPS57176484A publication Critical patent/JPS57176484A/ja
Publication of JPH036552B2 publication Critical patent/JPH036552B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Description

【発明の詳細な説明】 この発明は、特に取り込まれた文字パターンの
行切り出し制御を改良した光学的文字読取装置に
関する。
光学的文字読取装置(以下、OCRという)に
おける取り込まれた文字パターンの行切り出し方
法として、従来次のように行なわれていた。すな
わち、行方向の黒ビツトを見る機能を持たせ、黒
ビツトが検出されなかつた行位置を行間として行
切り出しを行なう方法である。また、他の方法と
して文字行位置を決めておき、その行位置に文字
を書いたり、印字しておき、読取のときは、その
行位置へ帳票を搬送させることで、行の切り出し
を行なわない方法をとつていた。
したがつて、行位置を指定せず多数行の読み取
りを行なわせるOCRでは、帳票のスキユーや、
印字ズレ等によつて、取り込まれた文字パターン
の行間にスペース行がなくなることもあり、行の
切り出しができなくなる場合があつた。具体的に
は、タイプライターでは、6行1インチで印字さ
れることもあり、この場合少しの帳票のスキユー
や印字ズレによつて取り込まれた文字パターンに
おいて行間が空かないことがある。
この発明は上記のような事情に鑑みてなされた
もので、たとえ帳票のスキユーや印字ズレがあつ
ても、取り込まれた文字パターンの行の切り出し
を的確に行なうことができる光学的文字読取装置
を提供することを目的とする。
以下、図面を参照してこの発明の一実施例を説
明する。第1図はこの発明の一実施例の概略構成
図である。図中、11は搬送部を示している。こ
の搬送部11は、帳票を搬送する機能を持つてい
る。12は光電変換部を示している。この光電変
換部12は、搬送部11により搬送されてきた帳
票を、その帳票の搬送方向と垂直方向に帳票表面
を走査し、帳票に記入された文字パターンを光電
変換する機能を持つている。13はラインバツフ
アを示している。このラインバツフア13は、光
電変換部12から送られてくる光電変換された文
字パターンを少なくとも1行分記憶する機能を持
つている。14は行切り出し部を示している。こ
の行切り出し部14は、2等分点検出部14a、
メモリ14b等を含んでいる。この行切り出し部
14は、ラインバツフア13に記憶された光電変
換された各文字パターンの水平射影の2等分点を
2等分点検出部14aで求め、求められた各2等
分点位置はメモリ14bに記憶され、このメモリ
14bの記憶内容に基づき行位置を定め行位置情
報GPを出力する機能を持つている。15は文字
切り出し部を示している。この文字切り出し部1
5は、行切り出し部14から送られてくる行位置
情報GPおよび予め与えられている文字ピツチ情
報により、ラインバツフア13に記憶されている
文字パターンを1文字単位で切り出す機能を持つ
ている。16は正規化部を示している。この正規
化部16は、文字切り出し部15において切り出
された文字パターンを、中心位置を合わせる等の
正規化を行なう機能を持つている。17は認識部
を示している。この認識部17は、正規化部16
から送られてくる正規化された文字パターンの認
識を行なう機能を持つている。
次に、上記実施例の動作を説明する。図示せぬ
帳票は、搬送部11により搬送され、その搬送方
向と垂直な方向に光電変換部12で走査され、光
電変換されたパターンがラインバツフア13へ書
き込まれる。
例えば第2図に示すように、ラインバツフア1
3に2行分の光電変換された文字パターンが、帳
票のスキユーあるいは印字ズレ等の原因で、2つ
の文字行の水平射影(行方向射影)が重なつてし
まうように書き込まれたとする。なお、第2図に
おいて、21は1行目の基底線を示し、22は2
行目の基底線を示している。また、23は上の行
の最下水平位置を示し、24は2行目の最上水平
位置を示している。したがつて、上の行の最下水
平位置23と次行の最上水平位置24間25が上
記2つの文字行の水平射影が重なる範囲を示して
いる。
次に、このように書き込まれた文字パターンの
行の切り出しを、第3図を参照して説明する。第
2図に示すように、ラインバツフア13に書き込
まれた文字パターン列において、2等分点検出部
14aは、各文字パターンを構成する各ブロツク
毎の水平射影の2等分点位置(P1,P2,P3…)
を以下のように算出する(第3図)。ここで、ブ
ロツクとは、文字パターンを構成する要素であ
る。各文字パターンは、単一または複数のブロツ
クにより構成される。例えば、片仮名文字「ル」
は、ブロツク「ノ」とブロツク「レ」のような複
数ブロツクからなる。したがつて、ブロツクを検
出する処理の段階では、文字パターンの切り出し
は実行されていない。文字パターンに対応する各
ブロツクは、文字切り出し部15におけるピツチ
情報に基づいて決定されることになる。
2等分点位置の算出処理では、行切り出し部1
4は、ラインバツフア13の各文字パターンを構
成しているブロツクをラスタスキヤン等の走査に
より検出した。そのブロツクの輪郭を追跡する。
輪郭追跡したブロツク毎に、バツフア13の水平
射影方向のアドレス(縦方向)の最大値、最小値
を検出記憶する。2等分点検出部14aは、これ
ら各ブロツクのアドレスの最大値、最小値からそ
れぞれの2等分点を算出し、メモリ14bに格納
する。2等分点検出部14aが、ラインバツフア
13上に展開されている全てのブロツクに対して
2等分点の計算を終了すると、行切り出し部14
は、メモリ14bから各2等分点間の距離を計算
し、この距離が最大になる値を固定位置間隔28
として保持する。行切り出し部14は、算出した
固定位置間隔28に対してメモリ14bに格納さ
れた2等分点が上にくるときは、その2等分点の
ブロツクをラインバツフア13の上の行に属する
ものと判定し、また下にくるときにはその2等分
点のブロツクを下の行に属するものと判定する。
行切り出し部14は、前記のような判定処理を実
行すると同時に、各ブロツクに対応する行位置情
報GPを文字切り出し部15に出力する。この行
位置情報GPにより、行の切り出し処理が実行さ
れることになる。
ここで、ラインバツフア13に書き込まれた文
字パターン列において、ラインバツフア13の上
下縁辺にぶつかつている文字パターンに対して
は、前記のような2等分点位置の検出処理を実行
しない。また、文字行を検出する段階では、各文
字は個々の文字として切り出しされていないが、
ブロツク(例えば第3図のjの点の部分も一つの
ブロツク)により構成されたものとして想定され
ている。
文字切り出し部15は、上記供給された行位置
情報GPおよび、予め与えられているピツチ情報
に基づき、ラインバツフア13に書き込まれた文
字パターンを1文字単位で切り出す。そして、切
り出された文字パターンは、正規化部16で正規
化され、認識部17で認識処理がなされる。この
認識結果が、答として出力される。
したがつて、このようなOCRでは次のような
効果を奏する。
(1) 隣接する各文字行の水平射影が重なつている
場合でも、行の切り出しが的確に行なえるた
め、読取率が向上する。
(2) 6行1インチのタイプ印字の文字も的確に読
み取りが行なえる。
(3) 行の切り出しが的確に行なわれるため各文字
行間の間隔を狭くすることができ、従来に比較
して帳票に多量の情報を盛り込むことができ
る。
以上述べたようにこの発明によれば、取り込ま
れた文字パターンの行の切り出しを的確に行なう
ことができる光学的文字読取装置を提供すること
ができる。
【図面の簡単な説明】
第1図はこの発明の一実施例のOCRの概略構
成図、第2図はラインバツフアに取り込まれた文
字パターンの内容の一例を示す図、第3図は上記
実施例の動作を説明するための図である。 11…搬送部、12…光電変換部、13…ライ
ンバツフア、14…行切り出し部、14a…2等
分点検出部、14b…メモリ、15…文字切り出
し部、16…正規化部、17…認識部。

Claims (1)

  1. 【特許請求の範囲】 1 帳票に記録された文字を光電変換する光電変
    換部と、 この光電変換部により光電変換された少なくと
    も文字行1行分の文字パターンを記憶するライン
    バツフアと、 このラインバツフアに記憶された各文字パター
    ンを構成する各ブロツク毎の水平射影の2等分点
    位置を検出する検出部と、 この検出部で得られた2等分点位置を記憶する
    メモリと、 このメモリに記憶された2等分点位置に基づい
    て各文字パターンの行位置を判定する判定手段
    と、 この判定手段により得られた行位置情報に基づ
    いて行毎に1文字単位の文字パターンを切り出す
    文字切り出し部と、 この文字切り出し部により切り出された文字パ
    ターンの認識を行なう認識部とを具備したことを
    特徴とする光学的文字読取装置。
JP56062226A 1981-04-24 1981-04-24 Optical character reader Granted JPS57176484A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56062226A JPS57176484A (en) 1981-04-24 1981-04-24 Optical character reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56062226A JPS57176484A (en) 1981-04-24 1981-04-24 Optical character reader

Publications (2)

Publication Number Publication Date
JPS57176484A JPS57176484A (en) 1982-10-29
JPH036552B2 true JPH036552B2 (ja) 1991-01-30

Family

ID=13194025

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56062226A Granted JPS57176484A (en) 1981-04-24 1981-04-24 Optical character reader

Country Status (1)

Country Link
JP (1) JPS57176484A (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2511131B2 (ja) * 1989-02-03 1996-06-26 富士通株式会社 文字認識装置
US5048096A (en) * 1989-12-01 1991-09-10 Eastman Kodak Company Bi-tonal image non-text matter removal with run length and connected component analysis
JPH03250387A (ja) * 1990-02-28 1991-11-08 Pfu Ltd 文字切出し方式

Also Published As

Publication number Publication date
JPS57176484A (en) 1982-10-29

Similar Documents

Publication Publication Date Title
US5164996A (en) Optical character recognition by detecting geo features
US4633502A (en) Optical recognizing apparatus
US5228095A (en) Apparatus for recognizing printed characters
KR20010015025A (ko) 문자인식장치의 문자추출방법 및 장치
JPH036552B2 (ja)
JPH0117191B2 (ja)
JPH0327953B2 (ja)
JP2913177B2 (ja) デジタルデータ記録紙
JPH039506B2 (ja)
JPH0340430B2 (ja)
JPH0713994A (ja) 文字認識装置
JPS6254380A (ja) 文字認識装置
JPH0373916B2 (ja)
JPH0696273A (ja) 帳票読み取り装置における認識フィールド検索方法
JPH0467674B2 (ja)
JPS63211082A (ja) 文字読取装置
JPH11250179A (ja) 文字認識装置および文字認識方法
JPS6343788B2 (ja)
JP2768814B2 (ja) 光学的文字読取装置
JPH05135204A (ja) 文字認識装置
JPH04139593A (ja) 郵便番号認識装置
JPH0433074B2 (ja)
JPH0981679A (ja) 光学式文字読取装置
JPH027183A (ja) 文字切出装置
JPS59128677A (ja) 光学的文字読取装置