JPS61269780A - 文字認識方式 - Google Patents

文字認識方式

Info

Publication number
JPS61269780A
JPS61269780A JP60111444A JP11144485A JPS61269780A JP S61269780 A JPS61269780 A JP S61269780A JP 60111444 A JP60111444 A JP 60111444A JP 11144485 A JP11144485 A JP 11144485A JP S61269780 A JPS61269780 A JP S61269780A
Authority
JP
Japan
Prior art keywords
pattern
don
black
care
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP60111444A
Other languages
English (en)
Other versions
JPH0580705B2 (ja
Inventor
Michiaki Nakanishi
道明 中西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP60111444A priority Critical patent/JPS61269780A/ja
Publication of JPS61269780A publication Critical patent/JPS61269780A/ja
Publication of JPH0580705B2 publication Critical patent/JPH0580705B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [概 要] 印字された漢字のように、「つぶれ」を有するパターン
に対して、内部の「つぶれ」をそのパターンにおける線
幅を予測して、Don’t Care  (無視)化す
ることにより、本来「白」の部分の「黒」エラー・カウ
ントを減らし、候補列中に真のカテゴリを上位に取り込
むことができるようにしたものである。
[産業上の利用分野コ 本発明は、文字その他の線図形の認識方式に係わり、さ
らに特定すれば、「つぶれ」のある文字その他の線図形
に対して特に有効な認識方式に関するものである。
[従来の技術] 印字された漢字、特に画数の多い漢字をドツト・プリン
タで印字したような場合は、第2図の例に示すように、
内部に「つぶれ」を生ずることがしばしばある。
第2図は、印刷された漢字「堰」を光電変換して2値化
したパターンであって、「堰」の文字のつくり側は、か
まえの中の「日」および「女」のそれぞれ中央部の白領
域がつぶれ、「黒」となっている。
上記のドツト・プリンタ印字における「つぶれ」は、1
文字を構成するドツト数と、ワイヤ・ドツトの寸法と、
文字の複雑度により生ずる必然的なものがあり、認識処
理装置側における光電変換部の分解能の向上によっては
救済できない。
従来の認識処理装置におけるパターン・マツチング手法
では、テンプレート・パターン作成時において、その処
理対象全体で、他との弁別で不可欠なところに重み付け
たり、2つ以上のテンプレート間での違いの部分につい
てのみマス゛りして、入力パターンを評価する等の工夫
がされている。
しかし、いずれも、入力パターンの「欠け」や、「つぶ
れ」に対しては充分な対策を講じていない。
[発明が解決しようとする問題点] パターンが文字であって、英数字程度の場合には、「つ
ぶれ」等もあまり影響せず分解能の向上で解決する部分
が多いが、画数の多い漢字等の場合は限界があり、「つ
ぶれ」対策が必要となる。
漢字等のようにカテゴリ数の多いもので、「単語チェッ
ク」的な後処理を含めて判断する場合には、候補列中に
真のカテゴリを取り込むことが重要となる。
本発明は、上記のような「つぶれ」に対して対策を講じ
た認識方式を提供しようとするものである。
[問題点を解決するための手段] 第1図は本発明の文字認識方式の処理の流れを示すブロ
ック図である。
第1図fa)において、lは認識処理対象パターンであ
り、2は光電変換部を示す。
3は多値画像情報を2値化し、ノイズを除去する等の前
処理であり、4は1文字又は1パターンごとに切り出す
、切出し処理であり、5は標準の大きさに正規化する処
理である。
6はDon’t Care化処理であって、第1図(b
)に示すように、3つの処理に別けられる。 61は、
従来からも行われている周辺部のDon’ t Car
e化処理であって、白黒境界における量子化誤差等を考
慮し、真の点部分だけを残し、周辺部をDon’tCa
re化(特徴抽出時ならびに全面照合時において無視す
ること)するものである。
62は、入力パターンの一部で線幅を計測する処理であ
る。
63は、61の周辺部Don’ t Care化処理結
果の白黒境界線より黒側へ、62で計測した線幅相当部
分を有効黒領域とし、残余をDon’t Care m
l域として、特徴抽出時ならびに全面照合時に無視する
領域とする処理である。
7は黒点数、周囲長数、「黒ラン」の連続量等の特徴抽
出、または圧縮化パターンによる照合により、少数の候
補カテゴリにしぼる大分類段階である。
8は7で選出された各候補間を差別するためのチェック
・ポイントを摘出する段階である。
9は各候補カテゴリの標準パターンとの全面照合の段階
であって、8で摘出したチェック・ポイントに対して重
みを付けて照合を行う。
10は一致度の最も高いカテゴリを出力する段階である
[作用] 上記手段におけるDon’t Care化処理6によっ
て、線間の空白部が「つぶれ」で「黒」となったと想定
される部分をDon’ t Care領域とすることに
よって、黒点数、周囲長数等による大分類情報の誤差を
減らすとともに、全面照合の際、本来「白」の部分の「
黒」エラー・カウントを減らすことができる。
これによって、真のカテゴリのエラー・カウントを少な
くして、候補列中で上位に選択できるようにしたもので
ある。
第1図に図示してないが、さらに単語等による後処理を
行う場合においても、真のカテゴリが、候補列中の上位
に選択されていることが重要である。
[実施例] 以下第2図〜第6図に示す実施例により、本発明をさら
に詳細に説明する。
第2図〜第4図は、本発明の一実施例の処理過程を説明
する図である。
第2図は、[従来の技術]の項で説明したように、中程
度の複雑さを持つ漢字「堰」の入力パターンを示す。
第3図は、パターン周辺部のDon’t Care化処
理の実施例を説明する図である。
これは、入力パターンの輪郭の1ビツトは、「白」 「
黒」の境界であることを示すもので、確実に「黒」であ
るわけではないので、輪郭の1ビツトをDon’t C
are化しその内側を有効「黒」とするものである。
周辺部Don’ t Care化処理は、第3図(a)
に示すX軸、Y軸それぞれの方向の2ビツトの比較器を
用いて白−黒の境界点をDon’t Care化する。
第3図(b)が周辺部Don’ t Care化処理語
処理結果パターン。
このパターンの一部の走査から線幅を計測し、線幅平均
2ビットを得る。
つぎに、第3図のパターンの縁から、さらに、線幅に相
当する2ビツトの幅を有効「黒」として登録し、残った
「黒」を内部Don’t Care点とする。
第4図は、内部Don’t Care化処理結果のパタ
ーンであって、黒塗り部分が内部Don’ t Car
e化された領域を示す。
Don’t Care領域は、画像メモリ上では、「黒
」パターン・データにおいて“1”から“0”に変えら
れ、「白」パターン・データにおいて“O”のままとし
ておくので、それぞれ、「黒」辞書パターンおよび「白
」辞書パターンと照合したときに、「白」でも「黒」で
もない領域として扱われることになる。
第5図は、長斜線検出におけるDon’ t Care
化処理の実施例を説明する図である。
第5図(alは、第3図のパターンについて、−45度
スリットによって斜め(右下がり)ストロークを検出し
た状況であって、「つぶれ」のため、どこでも斜めスリ
ットにかかり、「つぶれ」と文字間の差がなくなってい
る・ 第5図(blは、内部Don’ t Care化処理し
た結果について、−45度スリットによる長ストローク
の検出を行ったものであり、「黒」扱いしない部分があ
るため、「つぶれ」のない本来のものに近くなり、より
候補内容に信頼性が高まることを示している。
第6図は、複雑な漢字パターンにおける線幅計測と内部
Don’t Care化処理の実施例を説明する図であ
る。
第6図に示すのは、代表的の複雑な漢字の印刷パターン
「岩」であって、例えば左下に小さな丸で示した本来「
白」であるドツト部分も「つぶれ」のため「黒ぺた」と
なっている。
このような状況でも、線幅を計測するところがあること
を示し、その線幅によって、Don’t Care化領
域を設定したところを示す。
本発明は、上記に説明したように、主として印刷文字を
対象として、その「つぶれ」による不一致のための減点
を救済する方式であるが、手書き文字における特徴抽出
においても、この Don’tCare化処理は効果を
存するものである。
[発明の効果] 以上説明のように本発明によれば、複雑の文字等におけ
る線間埋まりを、比較的簡単な方法で、Don’ t 
Care化することによって、前段階の大分類において
、真のカテゴリを落すことなく、全面照合でも「つぶれ
」に強いマツチングが可能となり、ひいては、後段での
「単語」等による後処理を有効にすることができ、その
実用上の効果は大である。
【図面の簡単な説明】
第1図は本発明の文字認識方式の処理の流れを示すブロ
ック図、 第2図は中程度の複雑さを有する漢字の入力パターン、 第3図は周辺部Don’t Care化処理の実施例を
説明する図、 第4図は内部Don’t Care化処理の実施例を説
明する図、 第5図は長斜線検出におけるDon’t Care化処
理の実施例を説明する図、 第6図は複雑な漢字パターンの線幅計測と内部Don’
 t Care化処理の実施例を説明する図である。 (b)

Claims (1)

  1. 【特許請求の範囲】 文字その他の線図形パターンを認識処理する認識処理装
    置において、 前処理の終了した認識対象入力パターンの一部において
    線幅を抽出し、 前記認識対象入力パターンの白黒境界線より黒側へ、該
    線幅に等しい幅を有効黒とし、 残余を特徴抽出時ならびに照合時における、無視領域と
    するよう構成したことを特徴とする文字認識方式。
JP60111444A 1985-05-24 1985-05-24 文字認識方式 Granted JPS61269780A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60111444A JPS61269780A (ja) 1985-05-24 1985-05-24 文字認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60111444A JPS61269780A (ja) 1985-05-24 1985-05-24 文字認識方式

Publications (2)

Publication Number Publication Date
JPS61269780A true JPS61269780A (ja) 1986-11-29
JPH0580705B2 JPH0580705B2 (ja) 1993-11-10

Family

ID=14561353

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60111444A Granted JPS61269780A (ja) 1985-05-24 1985-05-24 文字認識方式

Country Status (1)

Country Link
JP (1) JPS61269780A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01214988A (ja) * 1988-02-23 1989-08-29 Fujitsu Ltd 文字認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01214988A (ja) * 1988-02-23 1989-08-29 Fujitsu Ltd 文字認識装置

Also Published As

Publication number Publication date
JPH0580705B2 (ja) 1993-11-10

Similar Documents

Publication Publication Date Title
KR100658119B1 (ko) 문자 인식 장치 및 방법
US8442319B2 (en) System and method for classifying connected groups of foreground pixels in scanned document images according to the type of marking
JP4232800B2 (ja) ラインノイズ除去装置、ラインノイズ除去方法、ラインノイズ除去プログラム
JPH04361391A (ja) 光学的文字認識システムおよび方法
CA2601144C (en) Method and system for adaptive recognition of distorted text in computer images
JP2004272798A (ja) 画像読み取り装置
CN107609482B (zh) 一种基于汉字笔画特征的中文文本图像倒置判别方法
Aravinda et al. Template matching method for Kannada handwritten recognition based on correlation analysis
Ullmann Picture analysis in character recognition
JPS61269780A (ja) 文字認識方式
Mostafa An adaptive algorithm for the automatic segmentation of printed Arabic text
Kibria Bengali optical character recognition using self organizing map
Shirali-Shahreza et al. Persian/Arabic text font estimation using dots
JP2812256B2 (ja) 文字認識装置および方法
Padma et al. Wavelet packet based texture features for automatic script identification
JP2578768B2 (ja) 画像処理方法
JP2747136B2 (ja) 文字認識装置
Bagga et al. CHARACTER SEGMENTATION MACHINE-TYPED DOCUMENTS USING KNN ALGORITHM
KR100317653B1 (ko) 대용량인쇄체문자인식을위한특징추출방법
Sahle Segmentation of Real Life Amharic Documents for Improving Recognition
JP2578767B2 (ja) 画像処理方法
Naveed et al. OHSCR: Benchmarks Dataset for Offline Handwritten Sindhi Character Recognition
Nagajyothi et al. Recognition of Hand written Numerals on bank Cheques using Neural Networks
Bucheet et al. Off-line Arabic signature recognition based on invariant moments properties
Mobarak OF COLLEGE OF EDUCATION……………… 2011

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term