JPS6316392A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPS6316392A
JPS6316392A JP61160016A JP16001686A JPS6316392A JP S6316392 A JPS6316392 A JP S6316392A JP 61160016 A JP61160016 A JP 61160016A JP 16001686 A JP16001686 A JP 16001686A JP S6316392 A JPS6316392 A JP S6316392A
Authority
JP
Japan
Prior art keywords
character
character pattern
sub
pattern
individual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61160016A
Other languages
English (en)
Inventor
Hiroe Fujiwara
藤原 啓惠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP61160016A priority Critical patent/JPS6316392A/ja
Publication of JPS6316392A publication Critical patent/JPS6316392A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、新聞・雑誌等の活字及び手書き文字を認識し
、例えばJ工Sコード等の情報量に変換する文字認識装
置に関するものである。
従来の技術 従来の文字認識装置では文字間隔が明確な文書、つまシ
読み取る文書の用紙上の絶対的な位置が予め判明してい
る文書を対象としてお夛、対象となる文書に制限を与え
ていた。この問題を解決するために、太発明者は先に、
入力された文書から認識対象となる文字列を幅W、高さ
Hの矩形で切り出し、その文字列において、文字列方向
に対し垂直に走査してヒストグラムを求め、そのヒスト
グラムから文字の切れ目を検出して文字パターンの構成
要素であるサブ文字パターンを求め、前記切り出した矩
形の高さHと前記文字列中のサブ文字パターンの幅vi
の中から最大値を求め、その値を文字パターンの基準幅
とし、その基準幅を基にサブ文字パターンを組み合わせ
て個別文字パターンを切シ出す文字認識装置を提案した
発明が解決しようとする問題点 しかしながら、実際には、第8図(&)に示す文字列の
ような場合、上記従来の技術では、サブ文字パターンを
組み合わせる過程において、濁点のサブ文字パターンS
5>84が各々”2+85と組合わされ、第8図(d)
に示すように切シ出しミスが生じていた。本発明は上記
問題点を解決することを目的としたもので、濁点・半濁
点を含む文字を正確に切シ出して認識することができる
文字認識装置を提供することを目的としている。
問題点を解決するための手段 本発明は前記問題点を解決するため、切シ出した文字列
に於いて文字列方向と垂直に走査してヒストグラムを求
め、ヒストグラムから文字の切れ目を検出して文字パタ
ーンの構成要素であるサブ文字パターンを求め、サブ文
字パターンのうチ高さ及び幅が基準値より小さい微小サ
ブ文字パターンについて前記微小サブ文字パターンの文
字列方向に垂直な方向の位置及び前記微小サブ文字パタ
ーンと前記微小サブ文字パターンに隣接するサブ文字パ
ターンとの間隔を基に前記微小サブ文字パターンを前記
微小サブ文字パターンに隣接するサブ文字パターンに結
合してサブ文字パターンを補正し個別文字パターン候補
を抽出し、前記個別文字パターン候補を組み合わせて個
別文字パターンを決定するように構成している。
作用 本発明は前記の技術的手段により、濁点・半濁点を含む
文字及びその文字に隣接する文字を正確に切り出すこと
ができ、文字認識の精度を向上させることができる。
実施例 以下、本発明の実施例について図面を参照しながら説明
する。
第1図は、本発明による文字認識装置の一実施例の構成
図である。1は画像入力部であり、認識対象文字を含む
画像を走査して2値信号で画像を入力し画像メモリ2に
格納する03は文字列切り出し部であシ、画像メモリ2
を走査して文字列を矩形で切り出す。4はサブ文字パタ
ーン抽出部であシ、文字列切り出し部3で切シ出しだ文
字列を列方向と垂直に走査して文字部のヒストグラムを
求め文字パターンの構成要素であるサブ文字パターンを
抽出する。5は個別文字パターン候補抽出部であり、サ
ブ文字パターン抽出部4で抽出したサブ文字パターンの
うち高さ及び堰が基準値より小さい微小サブ文字パター
ンについて前記微小サブ文字パターンの文字列方向に垂
直な方向の位置及び前記微小サブ文字パターンと前記微
小サブ文字パターンに隣接するサブ文字パターンとの間
隔を基に前記微小サブ文字パターンを前記微小サブ文字
パターンに隣接するサブ文字パターンに結合して個別文
字パターン候補を抽出する。6は個別文字パターン決定
部であυ、前記個別文字パターン候補抽出部において得
られた個別文字パターン候補を文字の基準幅を基に組み
合わせて個別文字パターンを決定する。7は認識部であ
り、個別文字パターン決定部らで得られた各個別文字パ
ターンのストローク等の特徴量を求め、予め辞書8に登
録されている文字の特徴量と照合し、最も似た文字を認
識候補文字とする。9は表示部であシ、認識部7で得ら
れた認識結果を表示する。
以上のように構成された文字認識装置の動作について、
まず第2図に示すような画像を入力した場合を例に説明
する。
画像入力部1から入力された第2図に示すような画像ば
2値化されて画像メモリ2に格納される。
文字列切シ出し部3は画像メモリ2に蓄えられている入
力画像から予め絶対的な位置が決められている文字列を
第3図(a)に示すように幅W、高さHの矩形Rで切り
出す。
次にサブ文字パターン抽出部4では、矩形Rで切シ出さ
れた文字列に対し、文字列方向に対し垂直に走査して文
字列のヒストグラムを第3図(b)に′示すように求め
、ヒストグラムの値が連続して1以上である部分をサブ
文字パターンとして、第3図(C)に示すようなサブ文
字パターンS1.S2.・・・・・・。
S6  を切シ出す。
個別文字パターン候補抽出部5では、文字列切り出し部
3で切り出された文字列の文字列方向に垂直な高さHの
1/αをサブ文字パターンの基準fiA 、 Hの1/
βをサブ文字パターンの基準高B。
文字列の中心線を文字の基準位置qとし、サブ文字パタ
ーン抽出部4で抽出された各サブ文字パターンの幅を”
Wi(i=1.2 、・・・・・・、6)、高さをki
(i=1.2.・・・・・・、e)、サブ文字パターン
31.とSiとの間隔をfi+tsiとSi++の間隔
をfiとするとき、マiくムかつki(BであシかつS
iの下限がQより上にありかつ’i+<1/γ×fiで
あれば、SiをSi、に結合し補正サブ文字パターンS
i、/を抽出する。更に上記補正サブ文字パターン31
−、/の幅をマi、/、高さを1(i、/とするとき、
マi 、’<人かつki−11くBでありかつ31−1
/の下限がQより上にあシかつWi2 < 1 /γX
fiであれば、31./をSi 2に結合する。例えば
α=4.β=3.γ=3とすると、S4の幅v 4(A
 (A =j / 4 X H)かつ高さka<B (
B =1/3XH)でありS4の下限が文字の基準位置
Qより上にあ!1lr3く1/3×f4であるからS4
を83に結合し補正サブ文字パターン83′を抽出する
。更に83′のm 73’ < A (ム=1/4×H
)かつ高さに3’(B (B =1/3 X H)であ
りS3′の下限が文字の基準位置Qよυ上にあシf2 
(1/ 3 X f4であるから3./を82に結合す
る。そして第3図(e)に示すように個別文字パターン
候補C1(i=1.・・・・・・、4)を抽出する。
個別文字パターン決定部6では、上記個別文字パターン
候補抽出部6で抽出した個別文字パターン候補01(i
=1.・・・・・・、4)について、個別文字パターン
候補C1の幅を”i、’iとC1−zの間幅をdi1文
字列切り出し部3で切シ出された文字列の文字列方向に
垂直な高さHを文字の基準幅CWとするとき の条件を満たせば個別文字パターン候補Cj、’・°“
°・・。
C]2を組み合わせて1つの個別文字パターンとする。
例えば、第3図(e)においてWs + (13+ W
4 (Q Wであるから、O5r 04が1つの個別文
字パターンとみなされ第3図(f)のように個別文字パ
ターンP1゜P21P3が決定される。
第4図に個別文字パターン候補抽出部5及び個別文字パ
ターン決定部eにおける処理のフローを示す0 認識部7では個別文字パターン決定部6で得られた個別
文字パターンP主について第5図(b)の矢印が示す方
向に着目画素を含んでM個以上連なっているか否かを調
べ方向コードを設定し、方向コード毎に各画素の連結性
を調べてストロークを抽出し、ス)+=+−りの数・位
置・長さ等の特徴量を抽出する。第5図(2L)に文字
「今」のストロークの抽出結果を示す。抽出した特徴量
を辞書8に登録されている特徴量と照合し、最も似た文
字を認識候補文字とし、表示部9で表示する。
上記動作の説明では、第2図に示すような横書きの画像
について説明したが、次に、第6図に示すような縦書き
の画像について説明する。
画像入力部1から入力された第6図に示すような画像は
2値化されて画像メモリ2に格納される。
文字列切り出し部3は画像メモリ2に蓄えられている入
力画像から予め絶対的な位置が決められている文字列を
第7図(a)に示すように高さW/9幅H′の矩形R′
で切り出すう 次にサブ文字パターン抽出部4では、矩形R′で切りだ
された文字列シて対し、文字列方向に対し垂直に走査し
て文字列のヒストグラムを第7図中)に示すように求め
、ヒストグラムの値が連続して1以上である部分をサブ
文字パターンとして、第7図(C)に示すようなサブ文
字パターンSi1 + S12+・・・・・・、S18
を切シ出す。
個別文字パターン候補抽出部5では、文字列切り出し部
3で切シ出された文字列の文字列方向に垂直な高さH′
の1/αをサブ文字パターンの基準幅A′、H′の1/
βをサブ文字パターンの基準高B′。
文字列の中心線を文字の基準位置Q′とし、サブ文字パ
ターン抽出部4で抽出された各サブ文字パターンの高さ
をvi(工=11,12.・・・・・・、 1a )。
福をに、(i=11.12 、・・印・、1s)、サブ
文字パターンSi、とs、  との間隔をfi−4,S
iとSi+、の間隔をfiとするとき、V工くム′かつ
に、 (B’であシかつSiの左限がQ′より右にあり
かつfi<1/rXfi−1fあレバ、SiをSi+、
ニ結合し補正サブ文字パターンSi+、/を抽出する。
更江上記補正サブ文字パターンSi+1’の高さをマi
−H’+墨をに、、tとするとき、v4.’(A′かツ
ki+、′<B′であシかつSi+、lの左限がQ′よ
り右にあシかつf4+ 1 < 17r x fij 
fあれば・Si+1′をSi+2に結合する。例え゛ば
α=3.β=3.γ=3とすると、S16の高さT16
 (A’ (A′=1 / 3 X H’)かツ幅に1
6<B’(B’=1/3XH’)であシS16の左限が
文字の基準位置Q′より右にあシf1b <1/3 X
 f+sであるからS16を817に結合し補正サブ文
字パターン817′を抽出する。更に817′について
みると高さマ、7′<ム′(ム’= 1/3x H’)
を満たさないので$17′はS1gに結合しない。そし
て第7図(d)に示すように個別文字パターン候補04
(i=11.・・・・・・。
17)を抽出する。
個別文字パターン決定部6では、上記個別文字パターン
候補抽出部5で抽出した個別文字パターン候補C1(i
=11.・・・・・・、17)について、個別文字パタ
ーン候補C工の高さをvri、 ciとCi++の間幅
をdi1文字列切シ出し部3で切り出された文字列の文
字列方向に垂直な高さH′を文字の基準幅cw’とする
とき前記〔1〕の条件を満たせば個別文字パターン候補
Cj1’・・・・・・、C10を組み合わせて1つの個
別文字パターンとする。例えば、第7図(d)において
W11+du +W12 (C; W’ テあるから、
011m ’t2が1つの個別文字パターンとみなされ
第7図(e)のように個別文字パターンP1jrP12
+・・・・・・。
p、6が決定される0 認識部7では個別文字パターン決定部6で得られた個別
文字パターンPiについて第5図中)の矢印が示す方向
に着目画素を含んでM個以上連なっているか否かを調べ
方向コードを設定し、方向コード毎に各画素の連結性を
調べてストロークを抽出し、ストロークの数・位置・長
さ等の特徴量を抽出する。そして抽出した特徴量を辞書
8に登録されている特徴量と照合し、最も似た文字を認
識候補文字とし、表示部9で表示する。
但し、個別文字パターン候補から個別文字ノくターンを
決定する方法及び特徴量の抽出方法は、上記実施例に示
す限シではない。
発明の効果 本発明によれば、認識対象文字列から個別文字パターン
を抽出する際に、濁点・半濁点の文字ノくターンを隣接
する文字パターンに正確に結合することにより、他Q個
別文字パターンの抽出もより正確に行なうことができ、
文字認識の精度を向上する事ができる。
【図面の簡単な説明】
第1図は本発明の一実施例による文字認識装置の構成図
、第2図は入力画像の一例の説明図、第3図は本発明の
一実施例において文字列から個別文字パターンを決定す
る方法の一例の説明図、第4図は本発明においてサブ文
字パターンから個別文字パターンを決定する過程の処理
のフロー図、第5図は文字認識方法の説明図、第6図は
入力画像の他の一例の説明図、第7図は本発明の一実施
例において文字列から個別文字パターンを決定する方法
の他の一例の説明図、第8図は従来の技術により文字列
から個別文字パターンを決定する方法の説明図である。 1・・・・・・画像入力部、2・・・・・・画像メモリ
部、3・・・・・・文字列切シ出し部、4・・・・・・
サブ文字・〈ターン佃出部、5・・・・・・個別文字パ
ターン候補抽出部、6・・・・・・個別文字パターン決
定部、7・・・・・・認識部、8・・・・・・辞書、9
・・・・・・表示部。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図 第2図 第3図 第5図 第6図 第8図 Pi      Pi   PS    P:第7図 IAJ−76・ン 8′−らメH Cd)          (e) C15Q    PI4 Q

Claims (1)

    【特許請求の範囲】
  1. 認識対象文字を含む画像を入力する画像入力部と、前記
    画像入力部で入力された画像から認識対象となる文字の
    集合である文字列を切り出す文字列切り出し部と、前記
    文字列切り出し部において切り出された文字列について
    、文字列方向に対して垂直に走査して文字を形成する画
    素のヒストグラムを求め、ヒストグラムの値が連続して
    M以上である部分をサブ文字パターンとして抽出するサ
    ブ文字パターン抽出部と、前記サブ文字パターン抽出部
    において得られたサブ文字パターンのうち高さ及び幅が
    基準値より小さい微小サブ文字パターンについて前記微
    小サブ文字パターンの文字列方向に垂直方向の位置及び
    前記微小サブ文字パターンと前記微小サブ文字パターン
    に隣接するサブ文字パターンとの間隔を基に前記微小サ
    ブ文字パターンを前記微小サブ文字パターンに隣接する
    サブ文字パターンに結合して前記サブ文字パターン抽出
    部において得られたサブ文字パターンを補正し個別文字
    パターン候補を抽出する個別文字パターン候補抽出部と
    、前記個別文字パターン候補抽出部において得られた個
    別文字パターン候補を組み合わせて個別文字パターンを
    決定する個別文字パターン決定部と、前記個別文字パタ
    ーン決定部により得られた個別文字パターンの特徴を計
    算し、前記特徴と辞書とを照合することにより認識候補
    文字を抽出する認識部を有することを特徴とする文字認
    識装置。
JP61160016A 1986-07-08 1986-07-08 文字認識装置 Pending JPS6316392A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61160016A JPS6316392A (ja) 1986-07-08 1986-07-08 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61160016A JPS6316392A (ja) 1986-07-08 1986-07-08 文字認識装置

Publications (1)

Publication Number Publication Date
JPS6316392A true JPS6316392A (ja) 1988-01-23

Family

ID=15706154

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61160016A Pending JPS6316392A (ja) 1986-07-08 1986-07-08 文字認識装置

Country Status (1)

Country Link
JP (1) JPS6316392A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01271890A (ja) * 1988-04-22 1989-10-30 Nec Corp 光学文字読取装置
JPH01292486A (ja) * 1988-05-19 1989-11-24 Sony Corp 文字認識装置及び方法
JPH03260886A (ja) * 1990-03-12 1991-11-20 Fuji Facom Corp 文字認識方法
US5450057A (en) * 1991-10-30 1995-09-12 Nissan Motor Co., Ltd. Stereophonic warning apparatus
JP2020004124A (ja) * 2018-06-28 2020-01-09 富士通株式会社 筆記選択プログラム、筆記選択方法および情報処理装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5991582A (ja) * 1982-11-16 1984-05-26 Nec Corp 文字読取装置
JPS59197581A (ja) * 1983-04-22 1984-11-09 Kanegafuchi Chem Ind Co Ltd 水平型電解槽への陽イオン交換膜の装着方法及び水平型電解槽

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5991582A (ja) * 1982-11-16 1984-05-26 Nec Corp 文字読取装置
JPS59197581A (ja) * 1983-04-22 1984-11-09 Kanegafuchi Chem Ind Co Ltd 水平型電解槽への陽イオン交換膜の装着方法及び水平型電解槽

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01271890A (ja) * 1988-04-22 1989-10-30 Nec Corp 光学文字読取装置
JPH01292486A (ja) * 1988-05-19 1989-11-24 Sony Corp 文字認識装置及び方法
JPH03260886A (ja) * 1990-03-12 1991-11-20 Fuji Facom Corp 文字認識方法
US5450057A (en) * 1991-10-30 1995-09-12 Nissan Motor Co., Ltd. Stereophonic warning apparatus
JP2020004124A (ja) * 2018-06-28 2020-01-09 富士通株式会社 筆記選択プログラム、筆記選択方法および情報処理装置

Similar Documents

Publication Publication Date Title
US7336813B2 (en) System and method of determining image skew using connected components
JP2822189B2 (ja) 文字認識装置及び方法
JPS6316392A (ja) 文字認識装置
JPH0410087A (ja) 基本ライン抽出方法
JP3197441B2 (ja) 文字認識装置
JPS62219187A (ja) 文字認識装置
JPH0584553B2 (ja)
JPS6210784A (ja) 文字認識装置
JP3193573B2 (ja) かぎかっこ付文字認識装置
JPH0528310A (ja) フオーム型文書識別装置
JP3411795B2 (ja) 文字認識装置
JPS61262985A (ja) 文字認識装置
JP2004094734A (ja) 文字認識方法および文字認識装置
JPH0573718A (ja) 領域属性識別方式
JP3381803B2 (ja) 傾き角検出装置
JPH05108882A (ja) 文字認識装置
JPS63225883A (ja) 文字認識装置
JPH10134145A (ja) 文字切り出し方法およびそれを用いた文字認識装置と、その文字切り出し方法を実行するプログラムを格納した、コンピュータが読取可能な記憶媒体
JPS6316391A (ja) 文字認識装置
JPH05274472A (ja) 画像認識装置
JPS6129981A (ja) 文字認識装置
JPH08101886A (ja) 文字認識装置
JPH0215388A (ja) 文字認識装置
JPH0350689A (ja) 文字認識装置
JPH0415776A (ja) 文字のサイズ情報抽出方法