JPS6219990A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPS6219990A
JPS6219990A JP60159035A JP15903585A JPS6219990A JP S6219990 A JPS6219990 A JP S6219990A JP 60159035 A JP60159035 A JP 60159035A JP 15903585 A JP15903585 A JP 15903585A JP S6219990 A JPS6219990 A JP S6219990A
Authority
JP
Japan
Prior art keywords
character
sub
character pattern
individual
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP60159035A
Other languages
English (en)
Other versions
JPH0584553B2 (ja
Inventor
Masahiro Shimizu
正博 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP60159035A priority Critical patent/JPS6219990A/ja
Publication of JPS6219990A publication Critical patent/JPS6219990A/ja
Publication of JPH0584553B2 publication Critical patent/JPH0584553B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、新聞・雑誌等の活字及び手書き文字を認識し
、例えばIXsコード等の情報量に変換する文字認識装
置に関するものである。
従来の技術 従来の文字認識装置では文字間隔が明確な文書、つまり
読み取る文書の用紙上の絶対的な位置が予め判明してい
る文書を対象としており、対象となる文書に制限を与え
ていた。
この問題を解決するために本発明者は先に入力された文
書から認識対象となる文字列を@w、高さHの矩形で切
り出し、文字の幅が各文字はぼ一定であることを利用し
て文字列の中から個別文字パターンを切り出す文字認識
装置を提案した。
発明が解決しようとする問題点 しかしながら、実際には文字には「偏」や「つくり」を
含んでいるものが多く、個別文字の切り出しを一定の幅
のみを基準として行なう手法では「偏」や「つくり」を
隣接する文字と混同し、個別文字の切り出しミスが生じ
ていた。本発明は上記問題点を解決することを目的とし
たもので、「偏」や「つくり」を含んでいる文字に対し
ても文字列から正しく個別文字を切り出し、文字認識を
行なうことができる文字認識装置を提供することを目的
としている。
問題点を解決するための手段 本発明は前記問題点を解決するため、幅W・高さHの矩
形で切り出した文字列に於いて文字方向と垂直に走査し
てヒストグラムを求め、ヒストグラムから文字の切れ目
を検出して文字パターンの構成要素であるサブ文字パタ
ーンを求め、例えば前記切り出した矩形の高さHと前記
文字列中のサブ文字パターンの幅Wi の中から最大値
を求めその値を文字パターンの基準幅Aとし、前記基準
幅Aを基にサブ文字パターンを組み合わせて個別文字パ
ターンを抽出し、前記個別文字パターンPkの幅へ、を
決定する過程に於いて、サブ文字パターンPsiが隣接
する個別文字パターンPk”k+1に同時に含まれる場
合、前記個別文字パターンPk、Pk+1の幅Cwk、
Cwk+1を比較し、前記サブ文字パターンPsiを前
記個別文字パターンPk。
Pk+1 のうち幅の狭い個別文字パターンに含めるよ
うに構成している。
作   用 本発明は前記の技術的手段により、「偏」や「つくジ」
を含んでいる文字でも正確に切り出し、文字認識が可能
となる。
実施例 以下、本発明の実施例について図面を参照しながら説明
する。
第1図は、本発明による文字認識装置の一実施例の構成
図である。1は画像入力部であり、認識対象文字を含む
画像を走査して2何倍号で画像を入力し画像メモリ2に
格納する。3は文字列切り出し部であり、画像メモリ2
を走査して文字列を矩形で切り出す。4はサブ文字パタ
ーン抽出部であり、文字列切り出し部3で切り出した文
字列を列方向と垂直に走査して文字部のヒストグラムを
求め文字パターンの構成要素であるサブ文字パターンを
抽出する。5は個別候補文字パターン抽出部であり、サ
ブ文字パターン抽出部4で抽出したサブ文字パターンの
組み合わせから個別候補文字パターンを抽出する。6は
個別文字パターン決定部であり、個別候補文字パターン
抽出部5で得られた各個別文字パターンにおいて、サブ
文字パターンが隣接する個別文字パターンに同時に含ま
れる場合、サブ文字パターンが含まれる個別文字パター
ンを一意的に決定する。7は認識部であジ、個別文字パ
ターン決定部6で得られた各個別文字パターンのストロ
ーク等の特微量を求め、予め辞書8に登録されている文
字の特微量と照合し、最も似た文字を認識候補文字とす
る。9は表示部であり、認識部7で得られた認識結果を
表示する。
以上のように構成された文字認識装置について、第2図
に示す入力画像を例に説明する。
画像入力部1から入力された第2図に示すような画像は
2値化されて画像メモリ2に格納されん文字列切り出し
部3は画像メモリ2に蓄えられている入力画像から予め
絶対的な位置が決められている文字列を第3図[alに
示すような矩形Rで切り出す。
次にサブ文字パターン抽出部4では矩形Rで切り出され
た文字列に対し、列方向と垂直に走査して文字列のヒス
トグラムを第3図fblに示すように求め、連続する文
字部により構成されるサブ文字パターンを切り出し、各
サブ文字パターンの幅Wi(i−1,2、・・・・・・
、8)を求める。第3図(clに切りだされたサブ文字
パターンP81 ” B2・・・・・・、Ps8を示す
個別候補文字パターン抽出部5ではサブ文字パターン抽
出部で抽出された各サブ文字パターンの中からサブ文字
パターンの幅w1 と矩形Rで切り出した文字列の高さ
Hとを比較し、その最大値を基準値Aとする。例えば第
3図(blではHが最大であり、基準値AはHとなる。
さらに隣接するサブ文字パターンを組み合わせ、サブ文
字パターン幅w、とサブ文字パターン間& biカ 1Σ7.+Σゎ、−A1≦α(α:定数)の条件を満た
す場合、隣接するサブ文字パターンを組み合わせて1つ
の個別候補文字パターンとし、個別候補文字パターンp
1.p2.・・・・・・、P7d[4図(alに示すよ
うに得られる。
個別文字パターン決定部6では個別候補文字パターン抽
出部で得られた個別文字パターンにおいてサブ文字パタ
ーンP8が隣接する個別文字パタ−ンに同時に含まれる
場合、前記サブ文字パターンPs、と左右の隣接するサ
ブ文字パターン間の距離を求め、サブ文字パターンPs
iをより近い側のサブ文字パターンの属する個別文字パ
ターンに含める。例えば第4図(alに於いてサブ文字
パターンPB4は個別候補文字パターンP3.P4に同
時に含まれているが、個別文字パターン@Cw3は0w
4より狭いのでサブ文字パターンPs4は個別候補文字
パターンP3 の一部とみなし、サブ文字パターンPs
5は個別候補文字パターンp4.p6に同時に含まれて
いるが、個別文字パターン1陥Cw、はCW4よシ狭い
のでサブ文字パターンPs5は個別候補文字パターンP
5の一部とみなし、第4図(blのように個別文字パタ
ーンは決定される。
認識部7では個別文字パターン決定部で得られた個別文
字パターンPi について第5図(′b)の矢印が示す
方向に着目画素を含んでM個以上連なっているか否かを
調べ方向コードを設定し、方向コード毎に各画素の連結
性を調べてストロークを抽出し、ストロークの数・位置
・長さ等の特微量を抽出する。第6図(alに文字1文
」のストロークの抽出結果を示す。抽出した特微量を辞
書8に登録されている特微量と照合し、最も似た文字を
認識部 。
補文字とし、表示部9で表示する。
発明の効果 本発明によれば、認識対象文字列から個別文字パターン
を抽出する場合に、「偏」や「つくり」を含んでいる文
字列に対しても個別文字パターンを正確に抽出すること
が出来、文字認識の精度を向上する事が出来る。
例えば第6図(a)において、認識対象文字「1列」は
p   、p  、p  、p   の4個のサプパs
10     gll    B12    s13タ
ーンに分解され、個別候補文字パターンP1゜。
Pllは第6図(b)のように得られ、サブ文字パター
ンPs2は個別文字パターンP1゜、Pllの両方に同
時に含まれている。この場合、PIi2に隣接するサブ
文字パターン間の距離を比較しなければ第6図(C)に
示すような2個の個別文pくターン”12”13が求め
られて切り出しミスが生じ、Ps2に隣接するサブ文字
パターン間の距離を比較することにより第6図(d)に
示すような個別文字パターンP14゜P15が正しく得
られることがわかる。
【図面の簡単な説明】
第1図は本発明の一実施例による文字認識装置の構成図
、第2図は入力画像の1例を示す図、第3図は文字列か
らサブ文字パターンを切り出す方法の説明図、第4図は
個別文字パターンを切り出した結果を示す図、第6図は
文字認識方法の説明図、第6図は個別文字パターンを切
り出した結果を示す図である。 1・・・・・・画像入力部、2・・・・・・画像メモリ
部、3・・・・・・文字列切り出し部、4・・・・・・
サブ文字パターン抽出部、6・・・・・・個別候補文字
パターン抽出部、6・・・・・・個別文字パターン決定
部、7・・・・・・認識部、8・・・・・・辞書、9・
・・・・・表示部。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図 第2図 第3図 (b) (C) PSHFS、、  FsIF’sa f’ss Fu 
 Fs7Fss第7F ss−ラ (b) ft  /’Z  f’3f’4  F’5  F6第
5図 第6図 ((L)      (b) (Q)(の

Claims (1)

    【特許請求の範囲】
  1. 認識対象文字を含む画像を入力する画像入力部と、前記
    画像入力部で入力された画像から認識対象となる文字の
    集合である文字列を幅w、高さHの矩形で切り出す文字
    列切り出し部と、前記矩形において文字列方向に対して
    垂直に走査して文字を形成する画素のヒストグラムを求
    め、ヒストグラムの値が1以上である文字部において連
    続する文字部から構成されるサブ文字パターンを抽出す
    るサブ文字パターン抽出部と、前記サブ文字パターン抽
    出部に於いて得られたサブ文字パターンP_s__iの
    幅をw_i、前記サブ文字パターンP_s__iに隣接
    するサブ文字パターンP_s__i__+__1間の距
    離をd_iとした場合、前記サブ文字パターンP_s_
    _iとサブ文字パターンP_s__j間の幅w_i_、
    _j(=w_i+d_i+w_i_+_1+・・・+w
    _j)が文字の基準幅A以下であればサブ文字パターン
    P_s__i、P_s__i__+__1・・・、P_
    s__jをひとつの個別候補文字パターンP_kとし、
    前記幅w_i_、_jを個別文字パターンP_kの幅C
    _w__kとする個別候補文字パターン抽出部と、前記
    サブ文字パターン抽出部において得られたサブ文字パタ
    ーンP_s__iが前記隣接する個別候補文字パターン
    P_kとP_k_+_1とに同時に含まれるとき、前記
    個別候補文字パターンP_k、P_k_+_1の幅C_
    w__k、C_w__k__+__1を比較することに
    よりサブ文字パターンP_s__iが属する個別文字パ
    ターンを一意的に決定する個別文字パターン決定部と、
    前記個別文字パターン決定部により得られた文字パター
    ンの特徴を計算し、前記特徴と辞書とを照合することに
    より認識候補文字を抽出する認識部を有することを特徴
    とする文字認識装置。
JP60159035A 1985-07-18 1985-07-18 文字認識装置 Granted JPS6219990A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60159035A JPS6219990A (ja) 1985-07-18 1985-07-18 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60159035A JPS6219990A (ja) 1985-07-18 1985-07-18 文字認識装置

Publications (2)

Publication Number Publication Date
JPS6219990A true JPS6219990A (ja) 1987-01-28
JPH0584553B2 JPH0584553B2 (ja) 1993-12-02

Family

ID=15684825

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60159035A Granted JPS6219990A (ja) 1985-07-18 1985-07-18 文字認識装置

Country Status (1)

Country Link
JP (1) JPS6219990A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63223890A (ja) * 1987-03-12 1988-09-19 Toshiba Corp 図面読取装置
JPH01271890A (ja) * 1988-04-22 1989-10-30 Nec Corp 光学文字読取装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63223890A (ja) * 1987-03-12 1988-09-19 Toshiba Corp 図面読取装置
JPH01271890A (ja) * 1988-04-22 1989-10-30 Nec Corp 光学文字読取装置

Also Published As

Publication number Publication date
JPH0584553B2 (ja) 1993-12-02

Similar Documents

Publication Publication Date Title
KR900007009B1 (ko) 문자인식장치
JPH05242292A (ja) 分離方法
CN109766893A (zh) 适于购物小票的图片文字识别方法
JPS6219990A (ja) 文字認識装置
Spitz Text characterization by connected component transformations
JP2661898B2 (ja) 文字認識装置
Carter Segmentation and preliminary recognition of madrigals notated in white mensural notation
JPS6316392A (ja) 文字認識装置
JP2537973B2 (ja) 文字認識装置
JPH0576671B2 (ja)
JPS6316391A (ja) 文字認識装置
JPS6210784A (ja) 文字認識装置
JPS63271588A (ja) 文字認識装置
JPH0664628B2 (ja) 文字認識装置
JP2993533B2 (ja) 情報処理装置及び文字認識装置
JPH0797390B2 (ja) 文字認識装置
JPH083829B2 (ja) 文字認識方法
JPS62219187A (ja) 文字認識装置
JPS63225883A (ja) 文字認識装置
JPS63311492A (ja) 文字認識装置
JPS6330991A (ja) 文字認識装置
JPH05174114A (ja) 情報処理装置及びそれを用いた文字認識装置
JPS63221495A (ja) 文字認識装置
JPS60147891A (ja) 文字認識装置
JPS62251888A (ja) 文字認識装置

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term