JPS6316391A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPS6316391A
JPS6316391A JP61160011A JP16001186A JPS6316391A JP S6316391 A JPS6316391 A JP S6316391A JP 61160011 A JP61160011 A JP 61160011A JP 16001186 A JP16001186 A JP 16001186A JP S6316391 A JPS6316391 A JP S6316391A
Authority
JP
Japan
Prior art keywords
character
sub
width
character pattern
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61160011A
Other languages
English (en)
Inventor
Masahiro Shimizu
正博 清水
Mariko Takenouchi
磨理子 竹之内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP61160011A priority Critical patent/JPS6316391A/ja
Publication of JPS6316391A publication Critical patent/JPS6316391A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、新聞・雑誌等の活字及び手書き文字を認識し
、例えばJ工Sコード等の情報量に変換する文字認識装
置に関するものである。
従来の技術 従来の文字認識装置では文字間隔が明確な文書、つまシ
読み取る文書の用紙上の絶対的な位置が予め判明してい
る文書を対象としており、対象となる文書に制限を与え
ていた。この問題を解決するために、本発明者は先に入
力された文書から認識対象となる文字列を幅W1高さH
の矩形で切シ出し、前記文字列から文字を構成するサブ
文字パターン抽出し、前記サブ文字パターンを結合する
ことにより個別文字パターンを決定し文字を切り比す文
字認識装置を提案した。
発明が解決しようとする問題点 しかしながら、実際には文字を構成する「偏」や「つく
り」は福が狭く、文字の、嘔と文字聞漏を同じ重みで扱
って個別文字の切り出しを行う手法では「偏」や「つく
り」を隣接する文字と混同し、個別文字の切シ出しミス
が生じていた。本発明は上記問題点を解決することを目
的としたもので、文字部の狭い「偏」や「つく9」を含
んでいる文字に対しても文字列から正しく個別文字を切
り出し、文字認識を行なうことができる文字認識装置を
提供することを目的としている。
問題点を解決するための手段 本発明は前記問題点を解決するため、画像入力部で入力
された画像から認識対象となる文字の集合である文字列
を幅W、高さHの矩形で切り出し、前記矩形において文
字列方向に対して垂直に走査して文字を形成する画素の
ヒストグラムを求め、ヒストグラムの値が1以上である
文字部において連続する文字部から構成されるサブ文字
パターンを抽出し、前記サブ文字パターンを結合して個
別文字パターンを決定する場合に、隣接するサブ文字パ
ターン間の距離に重み係数αを掛けることによりサブ文
字パターンの結合を判定するようKt3成している。
作用 本発明は前記の技術的手段により、「偏」や「「つクシ
」を含んでいる文字でも正確に切シ出し、文字認識が可
能となる。
実施例 以下、本発明の実施例について図面を参照しながら説明
する。
第1図は、本発明による文字認識装置の一実施例の構成
図でおる。1は画像入力部であシ、認識対象文字を含む
画像を走査して2値信号で画像を入力し画像メモリ2に
格納する。3は文字月切シ出し部でちり、画像メモリ2
を走査して文字列を矩形で切シ出す。4はサブ文字パタ
ーン抽出部であり、文字列切り出し部3で切シ出した文
字列を列方向と垂直に走査して文字部のヒストグラムを
求め文字パターンの構成要素であるサブ文字パターンを
抽出する。6は個別文字パターン抽出部であり、サブ文
字パターン抽出部4で抽出したサブ文字パターンの組み
合わせから個別文字パターンを抽出する。6は認識部で
あり、個別文字パターン抽出部5で得られた各個別文字
パターンのストローク等の特徴量を求め、予め辞書7に
登碌されている文字の特徴量と照合し、最も似た文字を
認識候補文字とする。8は表示部であり、認識部6で得
られた認識結果を表示する。
以上のように構成された文字認識装置について、第2図
に示す入力画像を例に説明する。
入力画像部1から入力された第2図に示すような画像は
2値化されて画像メモリ2に格納される。
文字列切り出し部3は画像メモリ2に蓄えられている入
力画像から予め絶対的な位置が決められている文字列を
第3図aに示すような矩形只で切り出す。
次にサブ文字パターン抽出部4では矩形Rで切りだされ
た文字列に対し、列方向と垂直に走査して文字列のヒス
トグラムを第3図すに示すように求め、連続する文字部
よシ構成さnるサブ文字パターンを切り出し、各サブ文
字パターンの幅W工(i=1.2.・・・・・・、8)
を求める。第3図Cに切りだされたサブ文字パターンP
SilPS□、・・・・・・。
PS8  を示す。
個別文字パターン抽出部5ではサブ文字パターン抽出部
で抽出された各サブ文字パターンの中からサブ文字パタ
ーンの幅Wiと矩形Rで切り出した文字列の高さYとを
比較し、その最大値を基準値ムとする。例えば第3図す
ではYが最大であり、基準値ムはYとなる。さらに隣接
するn個のサブ文字パターンを組み合わせた場合の文字
1g Q wを次式のようにサブ文字パターン幅Wiと
サブ文字パターン間の幅diに重み係数α(定数)を掛
けた値で定義する。
Cw=lΣyi+Σ(αxdi)1 ここでCwが C<Y の条件を満たす場合、隣接するn個のサブ文字パターン
を組み合わせて1つの個別文字パターンPiとする。例
えば、第4図aにおいてOvz+Cw□。
CW3ICMSICW61CW7はYよシ小さいが、C
W4はYより大きい。そこで個別文字パターンP1゜P
2.・・・・・・、P6が第4図すに示すように得られ
る。
認識部らでは個別文字パターン決定部で得られた個別文
字パターンPiについて第5図すの矢印が示す方向に着
目画素を含んでM個以上連なっているか否かを調べ方向
コードを設定し、方向コード毎に各画素の連結性を調べ
てストロークを抽出し、ストロークの数・位置・長さ等
の特徴量を抽出す8゜第5凹孔に文字「文」のストロー
クの抽出結果を示す。抽出した特徴量を辞書7に登録さ
れる特徴量と照合し、最も似た文字を認識候補文字とし
、表示部8で表示する。本実施例によれば、例えば第6
図aに示すような文字列に対しても正確に抽出すること
ができる。
第6図aにおいて、認識対象文字「1列」はPSjOI
PS++1Psj2およびPs13の4個のサブパター
ンに分解される。
いま、基準幅大が文字高さcoであり、サブ文字パター
ンPs1oとP81.を組み合わせた悟Cwは、文字量
幅の重み係数qを1にした場合50となり、基準値Aよ
り小さいので、第e211bに示すようにサブ文字パタ
ーンP310とP3,1で個別文字パターンを構成する
ことになり、文字パターン抽出誤シを起こすことになる
しかし、重み係数を2とした場合、Cwは7゜となりC
wは基準値Aより大きいのでサブ文字パターンPS、o
とP5,1は個別文字パターンを構成しないことがわか
る。
一方、サブ文字パターンP  、、P  。とP81 
     Sj  4    Sj5を組み合わせた場
合、重み係数を2としてもCwは55となり、基準値A
より小さく第6図Cのように正しく個別文字パターンを
決定することができる。
発明の効果 本発明によれば、認識対象文字列から個別文字パターン
を抽出する場合に、「偏」や「つくり」を含んでいる文
字列に対しても個別文字パターンを正確に抽出すること
が出来、文字認識の精度を向上する事が出来る。
【図面の簡単な説明】
第1図は本発明の一実施例による文字認識装置の構成図
、第2図は入力画像の1例を示す説明図、第3図は文字
列からサブ文字パターンを切り出す方法の説明図、第4
図は個別文字パターンの切シ出しの説明図、第5図は文
字認識方法の説明図、邸 第6図は個別文字パターンの切り出しの説明である0 1・・・・・・画像入力部、2・・・・・・画像メモリ
部、3・・・・・・文字列切り出し部、4・・・・・・
サブ文字パターン抽出部、5・・・・・・個別文字パタ
ーン抽出部、6・・・・・・認識部、7・・・・・・辞
書、8・・・・・・表示部。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図 第2図 第 3 図 (b) (C) P、s+     PS2   Ps3  P54 P
s5  &6   PS7    PS8第 4 図 Psr    Psz   P53 Ps+  Pss
  PS6   PS7    Pss(b) ?r     p2     P3Pa     P5
     P6第5図 (aン <b> ■ 第6図 (d) Ps+o Psn Psrz Psr3<b) CC)

Claims (1)

    【特許請求の範囲】
  1. 認識対象文字を含む画像を入力する画像入力部と、前記
    画像入力された画像から認識対象となる文字の集合であ
    る文字列を幅W、高さHの矩形で切り出す文字列切り出
    し部と、前記矩形において文字列方向に対して垂直に走
    査して文字を形成する画素のヒストグラムを求め、ヒス
    トグラムの値が1以上である文字部において連続する文
    字部から構成されるサブ文字パターンを抽出するサブ文
    字パターン抽出部と、前記サブ文字パターン抽出部に於
    いて得られたサブ文字パターンを結合して個別文字パタ
    ーンを決定する場合に、隣接するサブ文字パターン間の
    距離に重み係数αを掛けることによりサブ文字パターン
    の結合を判定する個別文字パターン決定部と、前記個別
    文字パターン決定部により得られた文字パターンの特徴
    を計算し前記特徴と辞書とを照合することにより認識候
    補文字を抽出する認識部を有することを特徴とする文字
    認識装置。
JP61160011A 1986-07-08 1986-07-08 文字認識装置 Pending JPS6316391A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61160011A JPS6316391A (ja) 1986-07-08 1986-07-08 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61160011A JPS6316391A (ja) 1986-07-08 1986-07-08 文字認識装置

Publications (1)

Publication Number Publication Date
JPS6316391A true JPS6316391A (ja) 1988-01-23

Family

ID=15706045

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61160011A Pending JPS6316391A (ja) 1986-07-08 1986-07-08 文字認識装置

Country Status (1)

Country Link
JP (1) JPS6316391A (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5991582A (ja) * 1982-11-16 1984-05-26 Nec Corp 文字読取装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5991582A (ja) * 1982-11-16 1984-05-26 Nec Corp 文字読取装置

Similar Documents

Publication Publication Date Title
KR100412317B1 (ko) 문자인식/수정방법및장치
JPH05242292A (ja) 分離方法
KR20000047428A (ko) 문자 인식 장치 및 방법
JPH1011531A (ja) 帳票読取装置
JP2000315247A (ja) 文字認識装置
JPS6316391A (ja) 文字認識装置
JPH0410087A (ja) 基本ライン抽出方法
JP2661898B2 (ja) 文字認識装置
JPH0584553B2 (ja)
JPS6316392A (ja) 文字認識装置
JP2537973B2 (ja) 文字認識装置
JP3197441B2 (ja) 文字認識装置
Karnik Identifying devnagri characters
JPH0576671B2 (ja)
JPS6330991A (ja) 文字認識装置
JP2993533B2 (ja) 情報処理装置及び文字認識装置
JPH0782525B2 (ja) 文字認識装置
JPS6378287A (ja) 文字認識装置
JPH0415776A (ja) 文字のサイズ情報抽出方法
JP2813600B2 (ja) 表形式文書読取装置
JPH0350689A (ja) 文字認識装置
JP2918363B2 (ja) 文字分類方法及び文字認識装置
JPS63225883A (ja) 文字認識装置
JPS6337490A (ja) 文字認識装置
JPS63221495A (ja) 文字認識装置