JPS6093577A - 文字切出し回路 - Google Patents

文字切出し回路

Info

Publication number
JPS6093577A
JPS6093577A JP58201484A JP20148483A JPS6093577A JP S6093577 A JPS6093577 A JP S6093577A JP 58201484 A JP58201484 A JP 58201484A JP 20148483 A JP20148483 A JP 20148483A JP S6093577 A JPS6093577 A JP S6093577A
Authority
JP
Japan
Prior art keywords
character
pattern
frame
entry frame
character entry
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58201484A
Other languages
English (en)
Inventor
▲はい▼ 東善
Touzen Hai
Yukikazu Kaburayama
蕪山 幸和
Yoshihisa Fujii
敬久 藤井
Eiichiro Yamamoto
山本 栄一郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP58201484A priority Critical patent/JPS6093577A/ja
Publication of JPS6093577A publication Critical patent/JPS6093577A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (a)発明の技術分野 本発明は文字読取り装置に係り、その構成要素として用
いる文字切出し回路に関する。
(b)技術の背景 OCR(光学文字読取り装置)に代表される文字読取り
装置では、印刷あるいは手書きによって帳票(文字記入
シート)に記入した文字パターンを光電変換走査袋装置
等によって観測し、得られたパターンデータの中から1
文字分ずつパターンデータを取り出して前処理・正規化
等の処理を施したのちそのパターンの特徴を抽出し、こ
れを予め文字榎毎に標準の文字パターンから抽出し認識
辞書に記憶した標準特徴と照合する等の手順によって認
識を行っている。
前記1文字分のパターンデータを取り出すことを文字の
切出しあるいはセグメンテーシツンと称し、この文字の
切出しを容易にするため、多くの文字読取り装置ではト
ロンプアウト(文字記入者には識別できるが観測部は観
測できないようなインクによる印刷)等によってI文字
毎に文字記入枠を設けた帳票を用い1文字記入者に対し
てはこの文字記入枠の中に文字を記入させると共に、一
方2文字読取り装置に対しては別に与えられるフォーマ
ント情報によって文字記入枠に関する情報(位置および
寸法等)が判るようにしている。
(C)従来技術と問題点 前述のように多くの文字読取り装置においては。
文字記入枠を設けた帳票を用い1文字読取り装置はフォ
ーマント情報から得る文字枠情報を基準として帳票上の
文字パターンを1文字分ずつ切出している。
ところが1文字記入者の不注意あるいは人力時の帳票の
位置ずれ等によって、ある文字記入枠に記入した文字の
一部分が隣接の文字記入枠の中にはみ出ることが少なく
ない。
すなわち、ある1文字分の文字パターンを切り出したと
き、その中に認識の妨げになる他の文字パターンの一部
分が混入したり、他の文字部へ突出したりするという結
果になり、そのために!1taを誤ったり認識不能を生
ずるという問題があった。
このような問題を避けるため、切り出した文字パターン
から文字記入枠に触れ且つ他の文字パターンから遊離し
ているようなパターンを取り除くような切出し装置も提
案されているが、逆に必要なパターンまで取り除き、そ
のために誤認識あるいは認識不能になるという欠点があ
った。
(d)発明の目的 本発明の目的は、認識の妨げになる不要なパターンを除
き認識に必要なパターンのみを切り出すことのできる文
字切出し装置を提供する事にある。
(e)発明の構成 すなわち9本発明になる文字9ノ出し回路は、1文字毎
に文字記入枠が定められた帳票上に記入された文字パタ
ーンを各文字記入枠を基準として1文字分ずつ切り出す
文字切り出し回路において。
切出し対象文字記入枠と該切出し対象文字記入枠に隣接
する文字記入枠とに記入され”ζいる文字パターンを観
測して得られる観測パターンの中から前記切出し対象文
字記入枠に重なっているパターンを抽出する抽出部と、
前記抽出部によって得られたパターンの面lff1心を
計算する計算部と、前記計算部によって得られた各部分
観測パターンの面積重心が前記切出し対象文字枠の外側
にあるか内側にあるかを識別する識別部と、前記識別部
による識別結果にしたがって前記切出し対象文字枠に対
応する観測パターンに刻し修正を施す修正部とを備える
ものである。
(f>発明の実施例 以下本発明の要旨を実施例によって具体的に説明する。
第1図は本発明−実施例の回路ブロック図を示し、1は
帳票に記入された文字パターンを観測し2値データによ
って表される観測パターンに変換する観測部、2は観測
部lによって帳票上の互いに隣接する複数の文字記入枠
に記入された文字パターンを観測して得られる観測パタ
ーンを格納するパターンメモリ、3はパターンメモリ2
から1文字分の切出し対象文字記入枠内に対応する観測
パターンを抽出する抽出部、4は抽出部3によって抽出
された観測パターンを一時記憶するパターンメモリ、5
は切出し対象文字記入枠と該切出し対象文字記入枠に隣
接する文字記入枠とに記入されている文字パターンを観
測して得られる観測パターンの中から前記切出し対象文
字記入枠に重なるパターンを抽出する抽出部、6は抽出
部5によって抽出された分離パターンを一時記憶するパ
ターンメモリ、7はパターンメモリ6に記憶する各分離
パターンの面積重心位置を計算する計算部。
8は計算部7によって得られた各分離パターンの面積重
心が前記切出し対象文字枠の外側にあるか内側にあるか
を識別する識別部、9は識別部8による識別結果にした
がってパターンメモリ4に記憶する観測パターンに対し
修正を施す修正部である。
以上のような構成において、観測部lによって得られた
第2図に例示するような観測パターンがパターンメモリ
2に記憶され、その中の「速Jという観測文字パターン
を切出す場合について次に説明する。
抽出部4によって第3図に示すような切出し対象文字記
入枠abcd内に対応する観測パターンが抽出されてパ
ターンメモリ4に記1意される。
一方、抽出部5によって切出し対象文字記入枠abcd
に重なるパターン■および■(第4図参照)が抽出され
てパターンメモリ6に記憶される。
第5図は計算部7の詳細ブ瞥、ドック図を示し、 71
ばパターンメモリ6のアドレスをxy座標のX座標値と
X座標値とによって指定するアドレス指定部、72は重
心位置計算の対象とする前記分離パターンを形成するパ
ターン形成jjjii累すなわち黒画素の数を計数する
計数回路、73ば1個毎の黒画素のX座標値を加算する
加算回路、74は1個毎の画素のX座標値を加算する加
算回路、75は加算回路73および加算回路74によっ
て得られる加算値に対し計数回路72によって得られる
11数値による除算を施す除算回路である。
すなわち、パターンメモリ(jには重心位置計算の対象
とする前記分離パターンを、これを形成する各黒画素の
位置を示す座標xyX座標値アドレスとして記憶−し、
計数回路72によって黒画素の総数Nを計数し、加算回
路73および加算回路74によって全黒画素のX座標値
およびX座標値の加算値ΣXおよびΣyをめ、除算回路
75によって。
XgミΣx / N Yg =Σy/N として1重心の位置座標XgおよびYgが得られる。
このようにして計算部7は第4図に例示するのおよび■
のような分離パターンに対しそれぞれの重心位置を計算
し、認識部8はそれぞれの重心位置が切出し対象文字記
入枠abedの内側にあるか外側にあるかを識別する。
識別部8による識別に基づいて、修正部9は第4図に例
示した■のような分離パターンは切出し対象観測パター
ンに含めるべき”ではないとし、■のような分離パター
ンは切出し対象パターンに含めるべきであるとし、結果
として第6図のようなパターンが切出されることになる
(g)発明の詳細 な説明したように、従来例によれば第3図のような観測
パターンあるいは第4図から■および■を除いたような
観測パターンが切出されるのに対し1本発明によれば第
6図のように認識の妨げになるパターンが除かれ必要な
パターンを含めたパターンを切り出すことができる。し
たがって。
文字読取り装置に用いたときの認識率を向上することが
できる。
【図面の簡単な説明】
第1図は本発明−実施例の回路プロンク図、第図中、5
は抽出部、7は計算部、8は識別部。 9は修正部である。 半 2 目 茅う図 早4昭 茅 5 国 手 乙 図

Claims (1)

    【特許請求の範囲】
  1. 1文字毎に文字記入枠が定められた帳票上に記入された
    文字パターンを各文字記入枠を基準として1文字分ずつ
    切り出す文字切り出し回路において、切出し対象文字記
    入枠と該切出し対象文字記入枠に隣接する文字記入枠と
    に記入されている文字パターンを観測して得られる観測
    パターンの中から前記切出し対象文字記入枠に重なって
    いるパターンを抽出する抽出部と、前記抽出部によって
    得られた分離パターンの面積重心を計算する計算部と、
    前記計算部によって得られた各部分観測パターンの面積
    重心が前記切出し対象文字枠の外側にあるか内側にある
    かを識別する識別部と、前記識別部による識別結果にし
    たがって前記切出し対象文字枠に対応する観測パターン
    に対し修正を施す修正部とを備えることを特徴とする文
    字切出し回路。
JP58201484A 1983-10-27 1983-10-27 文字切出し回路 Pending JPS6093577A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58201484A JPS6093577A (ja) 1983-10-27 1983-10-27 文字切出し回路

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58201484A JPS6093577A (ja) 1983-10-27 1983-10-27 文字切出し回路

Publications (1)

Publication Number Publication Date
JPS6093577A true JPS6093577A (ja) 1985-05-25

Family

ID=16441826

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58201484A Pending JPS6093577A (ja) 1983-10-27 1983-10-27 文字切出し回路

Country Status (1)

Country Link
JP (1) JPS6093577A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0508845A2 (en) * 1991-03-11 1992-10-14 Nippon Telegraph And Telephone Corporation Method and apparatus for image processing

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0508845A2 (en) * 1991-03-11 1992-10-14 Nippon Telegraph And Telephone Corporation Method and apparatus for image processing
EP0508845A3 (en) * 1991-03-11 1994-05-18 Nippon Telegraph & Telephone Method and apparatus for image processing

Similar Documents

Publication Publication Date Title
EP0063454B1 (en) Method for recognizing machine encoded characters
US5774580A (en) Document image processing method and system having function of determining body text region reading order
JP2940936B2 (ja) 表領域識別方法
JP3345224B2 (ja) パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置
EP3940589B1 (en) Layout analysis method, electronic device and computer program product
JPS6159568A (ja) 文書処理装置
JPH0467234B2 (ja)
KR100268367B1 (ko) 화성 처리 방법과 장치
US7142733B1 (en) Document processing method, recording medium recording document processing program and document processing device
JPS6093577A (ja) 文字切出し回路
CN112348112B (zh) 图像识别模型的训练方法、训练装置及终端设备
JPH0410087A (ja) 基本ライン抽出方法
CN113408532A (zh) 一种基于多特征提取的药品标签数字识别方法
CN111414816B (zh) 信息提取方法、装置、设备和计算机可读存储介质
JPS615383A (ja) 文字パタ−ン分離装置
JPH0991385A (ja) 文字認識辞書追加方法及びこれを用いた端末ocr装置
EP0446630A2 (en) Method and apparatus for segmenting characters in an amount field on a financial document
JPH01201789A (ja) 文字読取装置
JP2923004B2 (ja) 画像生成装置
US6142374A (en) Optical character reader
JP2004240500A (ja) 画像処理装置、画像処理プログラムおよび記憶媒体
JPH0353392A (ja) 文字認識装置
JPH05282487A (ja) 文字認識装置
JPH04156694A (ja) 文字認識方式
JPS61190676A (ja) 帳票登録装置