JPH0782525B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH0782525B2
JPH0782525B2 JP60151730A JP15173085A JPH0782525B2 JP H0782525 B2 JPH0782525 B2 JP H0782525B2 JP 60151730 A JP60151730 A JP 60151730A JP 15173085 A JP15173085 A JP 15173085A JP H0782525 B2 JPH0782525 B2 JP H0782525B2
Authority
JP
Japan
Prior art keywords
character
sub
character pattern
unit
width
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP60151730A
Other languages
English (en)
Other versions
JPS6210784A (ja
Inventor
正博 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP60151730A priority Critical patent/JPH0782525B2/ja
Publication of JPS6210784A publication Critical patent/JPS6210784A/ja
Publication of JPH0782525B2 publication Critical patent/JPH0782525B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、新聞・雑誌等の活字及び手書き文字を認識
し、例えばJISコード等の情報量に変換する文字認識装
置に関するものである。
従来の技術 従来の文字認識装置では文字間隔が明確な文書、つまり
読み取る文書の用紙上の絶対的な位置が予め判明してい
る文書を対象としており、対象となる文書に制限を与え
ていた。この問題を解決するために入力された文書から
認識対象となる文字列を幅W、高さHの矩形で切り出
し、文字の縦と横の長さの比が約1であることを利用し
て文字列の中から個別文字パターンを切り出していた
(例えば、秋山・内藤・増田“縦・横書き文書からの個
別文字切り出し法”信学技報PRL83−7)。
発明が解決しようとする問題点 しかしながら、実際には文字の縦横比が1に近くない場
合が多く、個別文字の切り出しを文字列の高さを基準と
して行なう手法では個別文字の切り出しミスが生じてい
た。
本発明は上記問題点を解決するもので、文字の縦横比が
1に近くない文字に対しても文字列から個別文字を切り
出し、文字認識を行なうことができる文字認識装置を提
供することを目的としている。
問題点を解決するための手段 本発明は上記問題点を解決するために、認識対象文字を
含む画像を入力する画像入力部と、前記画像入力部で入
力された画像から認識対象となる文字の集合である文字
列を幅W、高さHの矩形で切り出す文字列切り出し部
と、前記矩形において文字列方向に対して垂直に走査し
て文字を形成する画素のヒストグラムを求め、ヒストグ
ラムの値が一定値以上である文字部において連続する文
字部から構成されるサブ文字パターンを抽出するサブ文
字パターン抽出部と、前記文字列切り出し部で切り出さ
れた矩形の高さHと前記サブ文字パターン抽出部におい
て得られた各サブ文字パターンの幅Wiとの中から最大値
を求めて基準幅とし、基準幅を用いて隣接するサブ文字
パターンから個別文字パターンを決定する個別文字パタ
ーン抽出部と、前記個別文字パターン抽出部により得ら
れた文字パターンの特徴を計算し、前記特徴と辞書とを
照合することにより認識候補文字を抽出する認識部を有
する構成にしたものである。
作用 この構成により、幅W、高さHの矩形で切り出した文字
列において文字方向と垂直に走査してヒストグラムを求
め、ヒストグラムから文字の切れ目を検出して文字パタ
ーンの構成要素であるサブ文字パターンを求め、前記切
り出した矩形の高さHと前記文字列中のサブ文字パター
ンの幅Wiの中から最大値を求め、その値を文字パターン
の基準幅Aとし、前記基準幅Aを基にサブ文字パターン
を組み合わせて個別文字パターンを抽出する。これによ
り、文字の縦横比が1に近くない文字でも正確に切り出
し文字認識が可能となる。
また、偏と旁に別れる文字が連続する文字列の場合にお
いても、基準幅を用いて個別文字パターンを正確に抽出
することができ、文字認識の精度を向上することができ
る。
実施例 以下、本発明の一実施例について図面を参照しながら説
明する。第1図は本発明による文字認識装置の一実施例
の構成図である。1は画像入力部であり、認識対象文字
を含む画像を走査して2値信号で画像を入力し、画像メ
モリ部2に格納する。3は文字列切り出し部であり、画
像メモリ部2を走査して認識対象となる文字の集合であ
る文字列を幅W、高さHの矩形で切り出す。4はサブ文
字パターン抽出部であり、文字列切り出し部3で切り出
した前記矩形の文字列を列方向と垂直に走査して文字を
形成する画素のヒストグラムを求め、このヒストグラム
の値が1以上である文字部において文字パターンの構成
要素であるサブ文字パターンを抽出する。5は個別文字
パターン抽出部であり、前記文字列切り出し部3で切り
出された矩形の高さHと前記サブ文字パターン抽出部4
で抽出したサブ文字パターンの幅wiとを用いて隣接する
サブ文字パターンを組み合わせて個別文字パターンを決
定する。6は認識部であり、個別文字パターン抽出部5
で抽出した各文字パターンのストローク等の特徴量を求
め、予め辞書7に登録されている文字の特徴量と照合
し、最も似た文字を認識候補文字とする。8は表示部で
あり、認識部6で得られた認識結果を表示する。
このように構成された文字認識装置について、第2図に
示す入力画像を例に説明する。入力画像部1から入力さ
れた第2図に示すような画像は2値化されて画像メモリ
部2に格納される。文字列切り出し部3は画像メモリ部
に蓄えられている入力画像から予め絶対的な位置が決め
られている文字列を第3図(a)に示すような矩形Rで
切り出す。
次にサブ文字パターン抽出部4では矩形Rで切り出され
た文字列に対し、列方向と垂直に走査して文字列のヒス
トグラムを第3図(b)に示すように求め、連続する文
字部により構成されるサブ文字パターンを切り出し、各
サブ文字パターンの幅wi(i=1,2,…,8)を求める。第
3図(c)に切りだされたサブ文字パターンPs1,Ps2,
…,Ps8を示す。
個別文字パターン抽出部5ではサブ文字パターン抽出部
4で抽出された各サブ文字パターンの中からサブ文字パ
ターンの幅wiと矩形Rで切り出した文字列の高さHとを
比較し、その最大値を基準値Aとする。例えば第3図
(b)ではHが最大であり、基準値AはHとなる。さら
に隣接するサブ文字パターンを組み合わせて個別文字パ
ターンを抽出するに際し、サブ文字パターン幅wiとサブ
文字パターン間幅biが基準値Aを基に、 |Σwi+Σbi−A|≦α(α:定数) の条件を満たす場合、隣接するサブ文字パターンを組み
合わせて1つの個別文字パターンとし、個別文字パター
ンP1,P2,…P6を第4図に示すように決定する。
認識部6では個別文字パターン抽出部5で得られた個別
文字パターンPiについて第5図(b)の矢印が示す方向
に着目し、画素を含んでM個以上連なっているか否かを
調べる方向コードを設定し、方向コード毎に各画素の連
結性を調べてストロークを抽出し、ストロークの数、位
置、長さ等の特徴量を抽出する。第5図(a)に文字
『文』のストロークの抽出結果を示す。抽出した特徴量
を辞書7に登録されている特徴量と照合し、最も似た文
字を認識候補文字とし、表示部8で表示する。
例えば第6図(a)において、認識対象文字『情報』は
Ps10,Ps11,…Ps15の6個のサブパターンに分解され、サ
ブ文字パターンの最大幅はW13である。ここで切り出し
矩形の高さH1を考慮に入れずに、サブ文字パターンの最
大幅のみを用いて個別文字パターンを決定すれば、第6
図(b)のようなP10,P11,P12,P13の4個の個別文字パ
ターンが求められる結果となり、切り出しミスが生じ
る。
また第7図(a)において、認識対象文字『一皿』はP
S16,PS17の2個のサブパターンに分解され、切り出し矩
形の高さH2はサブ文字パターンの幅w16,w17よりも小さ
く、サブ文字パターンの最大幅を考慮に入れずに、切り
出し矩形の高さH2のみを用いて個別文字パターンを決定
すれば、第7図(b)のようなP14,P15,P16,P17の4個
の個別文字パターンが求められる結果となり、切り出し
ミスが生じる。
しかし第6図、第7図の場合においても、切り出し矩形
の高さとサブ文字パターンの最大幅のうち大きい値を用
いて文字切りだしを行なえば正しく切り出せることがわ
かる。
発明の効果 以上本発明によれば、認識対象文字列から個別文字パタ
ーンを抽出する場合に、文字パターンの縦横比が1に近
くなくても個別文字パターンを正確に抽出することが出
来、文字認識の精度を向上する事が出来る。
また、偏と旁に別れる文字が連続する文字列の場合にお
いても、基準幅を用いて個別文字パターンを正確に抽出
することができ、文字認識の精度を向上することができ
る。
【図面の簡単な説明】
第1図は本発明の一実施例による文字認識装置の構成
図、第2図は入力画像の1例を示す図、第3図は文字列
からサブ文字パターンを切り出す方法の説明図、第4図
は個別文字パターンを切り出した結果を示す図、第5図
は文字認識方法の説明図、第6図および第7図はそれぞ
れ切り出しミスの生じる場合の説明図である。 1……画像入力部、2……画像メモリ部、3……文字列
切り出し部、4……サブ文字パターン抽出部、5……個
別文字パターン抽出部、6……認識部、7……辞書、8
……表示部

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】認識対象文字を含む画像を入力する画像入
    力部と、前記画像入力部で入力された画像から認識対象
    となる文字の集合である文字列を幅W、高さHの矩形で
    切り出す文字列切り出し部と、前記矩形において文字列
    方向に対して垂直に走査して文字を形成する画素のヒス
    トグラムを求め、ヒストグラムの値が一定値以上である
    文字部において連続する文字部から構成されるサブ文字
    パターンを抽出するサブ文字パターン抽出部と、前記文
    字列切り出し部で切り出された矩形の高さHと前記サブ
    文字パターン抽出部において得られた各サブ文字パター
    ンの幅Wiとの中から最大値を求めて基準幅とし、基準幅
    を用いて隣接するサブ文字パターンから個別文字パター
    ンを決定する個別文字パターン抽出部と、前記個別文字
    パターン抽出部により得られた文字パターンの特徴を計
    算し、前記特徴と辞書とを照合することにより認識候補
    文字を抽出する認識部を有する文字認識装置。
JP60151730A 1985-07-09 1985-07-09 文字認識装置 Expired - Lifetime JPH0782525B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60151730A JPH0782525B2 (ja) 1985-07-09 1985-07-09 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60151730A JPH0782525B2 (ja) 1985-07-09 1985-07-09 文字認識装置

Publications (2)

Publication Number Publication Date
JPS6210784A JPS6210784A (ja) 1987-01-19
JPH0782525B2 true JPH0782525B2 (ja) 1995-09-06

Family

ID=15525034

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60151730A Expired - Lifetime JPH0782525B2 (ja) 1985-07-09 1985-07-09 文字認識装置

Country Status (1)

Country Link
JP (1) JPH0782525B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2822189B2 (ja) * 1988-05-19 1998-11-11 ソニー株式会社 文字認識装置及び方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5991582A (ja) * 1982-11-16 1984-05-26 Nec Corp 文字読取装置

Also Published As

Publication number Publication date
JPS6210784A (ja) 1987-01-19

Similar Documents

Publication Publication Date Title
KR900007009B1 (ko) 문자인식장치
JP2000315247A (ja) 文字認識装置
JPH0782525B2 (ja) 文字認識装置
JP2661898B2 (ja) 文字認識装置
JPH0584553B2 (ja)
JP2537973B2 (ja) 文字認識装置
JPS6316392A (ja) 文字認識装置
JP3457094B2 (ja) 文字認識装置及び文字認識方法
JPH0797390B2 (ja) 文字認識装置
JPH0576671B2 (ja)
JPS62219187A (ja) 文字認識装置
JPS63221495A (ja) 文字認識装置
KR100248384B1 (ko) 다국어 문서 인식에서 개별 문자 추출 방법 및 그 인식 시스템
JPS6330991A (ja) 文字認識装置
JPH07107700B2 (ja) 文字認識装置
JPH0664628B2 (ja) 文字認識装置
JPH0632079B2 (ja) 文字認識装置
JPH0215388A (ja) 文字認識装置
JPH0350689A (ja) 文字認識装置
JPS6316391A (ja) 文字認識装置
Babić Cursive word raw segmentation based on scanning Skew slots
JPS6378287A (ja) 文字認識装置
JPS63225883A (ja) 文字認識装置
JPH01237879A (ja) 名刺情報ファイリング方式
JPH0578068B2 (ja)

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term