JPS62194590A - 文字認識方式 - Google Patents

文字認識方式

Info

Publication number
JPS62194590A
JPS62194590A JP61036633A JP3663386A JPS62194590A JP S62194590 A JPS62194590 A JP S62194590A JP 61036633 A JP61036633 A JP 61036633A JP 3663386 A JP3663386 A JP 3663386A JP S62194590 A JPS62194590 A JP S62194590A
Authority
JP
Japan
Prior art keywords
segment
threshold
segments
short
line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61036633A
Other languages
English (en)
Inventor
Michiaki Nakanishi
道明 中西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP61036633A priority Critical patent/JPS62194590A/ja
Publication of JPS62194590A publication Critical patent/JPS62194590A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔目次〕 概要 産業上の利用分野 従来の技術 発明が解決しようとする問題点 問題点を解決するための手段 (第1図)作用 実施例 (a)本発明の詳細な説明 (第2図、第3図、第4図) (b1本発明の一実施例(第5図) 発明の効果 〔概要〕 文字の構成を方向別特徴化するとき、閾値以上の長さの
ものについては一本の線として捉えられるものは統合的
に考慮し、闇値以下の長さのものについては点かノイズ
かを判別して点画を忠実に反映した特徴を得るようにし
たもの、である。
〔産業上の利用分野〕
本発明は文字認識方式に係り、特に光電変換装置により
文字、シンボル等の2値パターンを得て特徴抽出を行い
辞書と照合して判定を行うときに線方向特徴を抽出し、
文字線の交差分岐接触等を考慮して元の一本のストロー
クに近似した特徴に統合し、また闇値により短線を別途
抽出して短点を正確に抽出することができるものに関す
る。
紙面に書かれたり、金属板に刻印された文字、シンボル
等を光電変換装置により入力し、これを2値化して特徴
抽出を行い、辞書と照合して文字認識することが行われ
ている。
〔従来の技術〕
従来のこのような文字認識方式では、前記2値化パター
ンの白−黒あるいは黒−白の変化点を求めることにより
得られたストローク等を抽出してその大きさがある闇値
以上のものを選出し、そのストロークの方向別等の特徴
等にもとづき辞書と照合していた。
〔発明が解決しようとする問題点〕
前記の特徴抽出では、ある特徴が存在するかしないかは
、闇値により決定され、その抽出された大きさが閾値以
下のものは、それが閾値ぎりぎりのものであっても捨て
られる場合が普通であり、得点式にした場合でもその評
価が複雑で現実的ではない。
また、「無」とか、「縄」のように、交点が多い文字等
については、短線素の集合となり、ストロークの方向別
の特徴比較が文字認識で有効であるといっても、このよ
うに短線素の数が多くなるとその取扱いが複雑となる。
本発明の目的は、前記の如き問題点を解決するために闇
値以下のものでもその特徴的なものは抽出可能とし、複
数の線素であってもその相互位置によりもとのストロー
クに近い形に統合化することにより、情報の欠損を少な
くし 入カバターンに忠実な特徴を得てこれにより文字
認識を行うようにした文字認識方式を提供するものであ
る。
〔問題点を解決するための手段〕
前記目的を達成するため、本発明では、第1図に示す如
く、例えば紙面1上の文字、シンボルを光電変換部を有
する入力部2にてよみとり、その2値化データをメモリ
3に保持し、特徴抽出処理部4にて特徴抽出し、その特
徴を照合部5にて辞lF6と照合する。このとき、特徴
抽出処理部4では、線分11.12の如く、閾値以上の
長線分でその端点の距離および方向等よりこれらを一本
の線として特徴した方がよいものについては統合処理を
行って一本の線として統合化し、また線分S1、S2の
如く闇値以下の短線素については、例えばペアを構成し
ている等の観点より孤立点を正しく抽出する。
〔作用〕
本発明では、第1図の線分7!1.12の如く、1本の
線として判断した方がよいものに対してはこれらを元の
一本のストロークとして統合化し、また孤立点も正確に
検出できるので、文字の認識において文字を構成する線
素を人間が判断しているストロークに近い形で抽出し、
特徴照合を行うことができる。
〔実施例〕
本発明の一実施例を第2図〜第5図にもとづき説明する
第2図は本発明における特徴パターン抽出状態説明図、
第3図は線分の統合化処理説明図、第4図は特徴抽出パ
ターン、第5図は本発明の一実施例構成図を示す。
(a1本発明の詳細な説明 本発明の一実施例構成を説明するに先立ち、その特徴抽
出の態様について説明する。
例えば第2図に示す如く、「犬」という2値パターンC
がメモリに格納されているとき、これを上下、左右、左
45度、右45度の方向でスキャンを行い、白と黒また
は黒と白の境界領域でこの境界領域が連続した部分を抽
出する。すなわち、上下方向にスキャンしてマスクM1
またはM2に相当する境界領域を抽出するとき、A1の
上または下の区分に示す線分が得られる。第2図A1の
上、下、点の区分に示す線分11.11′、12、(1
2t、El)、E4、Sはそれぞれ、2値パターンCの
7!1.7!1′、12、I12’ EpSE4、Pに
対応するものである。同様に、左右方向にスキャンして
マスクM3またはM4に相当する境界領域を抽出すると
き、A2の左または右の区分に示す線分が得られ、右4
5度にスキャンしてマスクM5またはM6に相当する境
界領域を抽出するときA3の各マスクMS、MSの下方
区分に示す線分が得られ、左45度にスキャンしてマス
クM7またはMSに相当する境界領域を抽出するときA
4の各マスクM7、MSの下方区分に示す線分が得られ
る。そしてA1−A4において閾値以下の短線素を集め
たものを点区分に示す。
ところで、線分11.11′およびI12、E2′は元
Cよ一本の線であるので、11とt 、 l及び12と
12′を統合して特徴抽出した方が望ましい。そのため
第3図(a)に示す如く、線分■と■を統合するか否か
を判断するとき、同(b)、(C)に示す如く、線分■
の始点Sと終点Eの近傍に線分■が存在するか否かチェ
ックする。このために、ある闇値(通常は文字等の太さ
にもとづき決定される)内に存在するかをチェックすれ
ばよい。もし近傍に存在することがわかったなら、第3
図(d)の如く、線分■を延長して線分■の終点Eがこ
の線分■の延長線上の近く (ある闇値内)にあるか否
かをチェックし、ある場合には線分■と■は方向性が一
致するものと判断し、線分■と■は、元は第3図(e)
のS−Eに示す如く一本の線であるものとして統合する
。このとき、情報としては、第3図(elの括弧内の如
く、線分■と■は一本の線であるもののその中央部分が
切断された状!3(あるいは他の線分がクロスしている
状態)であるということで取扱われることになる。
第2図のA1の上または下の区分に示す線分から閾値以
上のものを抽出し、それら、を統合処理した結果が同図
左側のA1′の上または下の区分に示される。勿論辞書
で照合する場合、11.12、!1′、12’は中央部
分が切断(クロス)された一本の線として取扱われる。
このように線分の長さによる閾値処理、この闇値以上の
線分の統合処理により、第4図に示す如く、A1、A2
、A3、A4の4面方向の3種類のパターンが抽出され
る。なおA1−A4において(短)は線分長が閾値以上
のものをまとめたものである。
ところでこのA1−A4  (短)パターンには、「犬
コの特徴となる第2図の点P(これがないと大、太等と
区別ができない)の他に文字のストロークの端点(Ep
、E1〜E4)にもとづくものが混在している。ところ
で点Pを示すパターンは、ある闇値内でペアを形成して
おりこれにより他のものと識別することが可能である。
このようにして、照合に不可欠な特徴となる短線素につ
いてはこれを正確に抽出し、また元が一本の線に対して
は統合的に取扱うことができるので、辞書との照合を正
確に、しかも容易に行うことができる。
+b1本発明の一実施例 本発明の一実施例構成を第5図にもとづき、他図を参照
しつつ説明する。なお、第5図において第1図と同符号
部は同一部分を示す。
第5図において、1は紙面や金属板(以下紙面という)
であって文字、シンボルが記入されるもの、2はイメー
ジセンサとして作用する入力部であってレンズ2−1お
よびCCDの如き光電変換部2−2を具備するもの、3
はメモリ、4は特徴抽出処理部、5は照合部、6は辞書
、7は前処理・2値化部であってスムージング処理や濃
度傾斜補償等の前処理を行ったり、入力データを2値化
処理を行うもの、8は文字分離部であってメモリ3に保
持された2値化パターンを1文字毎に分離処理するもの
である。
特徴抽出処理部4は、第2図に示す如く2値パターンを
スキャンして得られたデータを第3図に示す如く、統合
処理したり、短線素、を抽出してそのうちの必要な部分
を前記の如く選出処理するものであり、走査部4−1、
統合化処理部4−2、短線素抽出部4−3等を具備する
走査部4−1は2値化パターンを上下左右斜方向にスキ
ャンして、前記第2図A1〜A4に示す如く、白−黒ま
たは黒−白の連続した境界線分を得るとともにその線分
長が闇値より長いか短かいかを選択し、長いものを統合
化処理部4−2に送出し、短かいものを短線素抽出部4
−3に送出するものである。
統合化処理部4−2は、この送出された線分を、第3図
に示す如き統合化処理を行う、統合化できるものは前記
の如く統合化し、できないものはそのまま出力するもの
である。
短線素抽出部4−3は、前記第4図A1〜A4(短)区
分の如く、短線分を抽出し、このうち特徴点の照合に必
要なものを選出するものであり、例えば、闇値内にペア
を形成する点P等を選出するものである。
次に第5図の動作について説明する。
まず紙面1上の文字、シンボル等を入力部2でよみとっ
てこれを光学信号より電気信号に変換する。この電気信
号を前処理・2値化部7で前処理を行って2値化し、こ
の2値化されたパターンをメモリ3に順次格納する。文
字分離部8はこのメモリ3上のパターンを1文字毎に分
離して特徴抽出処理部4に送出する。
特徴抽出処理部4ではこれを走査部4−1で前記の如く
スキャンして、得られた線分が予め定められた闇値より
大であれば統合化処理部4−2に送出し、短かければ短
線素抽出部4−3に送出する。統合化処理部4−2はこ
れらを前記統合処理し、統合可能なものは統合し、統合
できないものはそのまま照合部5に送出する。また短線
素抽出部4−3では前記の如く特徴点の照合に必要なも
のを選出して照合部5に送出する。
照合部5では、これら統合化処理部4−2および短線素
抽出部4−3より伝達されたデータにもとづき辞書6と
照合し、判定結果を出力する。
〔発明の効果〕 本発明によれば短線素についても特徴点を安定に抽出す
ることができ、また線素間の相互位置により元のストロ
ークに近い形で統合して照合することができる。したが
って漢字等で画数は多いが微少差しかないものの分離が
冗長度をもった特徴抽出と照合で可能となり、また大き
さや形状ストロークの相対位置関係がずれたフォント間
のシンプルテンプレートによるマツチングや手書きでの
個人的くせ等を吸収した、効果的な文字認識を行うこと
ができる。
【図面の簡単な説明】
第1図は本発明の原理説明図、 第2図は本発明における特徴パターン抽出状態説明図、 第3図は線分の統合化処理説明図、 第4図は特徴抽出パターンの一例、 第5図は本発明の一実施例構成図である。 2・・−人力部 3・・・−メモリ 4・−特徴抽出処理部 5−・−照合部 6・−辞書 7−・−前処理・2値化部 8−文字分離部

Claims (1)

  1. 【特許請求の範囲】 光電変換手段を備え、文字、シンボル等の2値化パター
    ンを得て文字切出し、特徴抽出、照合判定を行う文字認
    識方式において、 線分を元の一本のストロークに統合化する統合化処理手
    段(4−2)と、 短線よりその特徴を抽出する短線素抽出手段(4−3)
    を具備したことを特徴とする文字認識方式。
JP61036633A 1986-02-21 1986-02-21 文字認識方式 Pending JPS62194590A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61036633A JPS62194590A (ja) 1986-02-21 1986-02-21 文字認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61036633A JPS62194590A (ja) 1986-02-21 1986-02-21 文字認識方式

Publications (1)

Publication Number Publication Date
JPS62194590A true JPS62194590A (ja) 1987-08-27

Family

ID=12475239

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61036633A Pending JPS62194590A (ja) 1986-02-21 1986-02-21 文字認識方式

Country Status (1)

Country Link
JP (1) JPS62194590A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02158891A (ja) * 1988-12-12 1990-06-19 Fujitsu Ltd 文字パターン認識装置
EP0535609A2 (en) * 1991-10-01 1993-04-07 Ezel Inc. Branch deletion method for thinned image

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02158891A (ja) * 1988-12-12 1990-06-19 Fujitsu Ltd 文字パターン認識装置
EP0535609A2 (en) * 1991-10-01 1993-04-07 Ezel Inc. Branch deletion method for thinned image
EP0535609A3 (ja) * 1991-10-01 1994-01-05 Ezel Inc

Similar Documents

Publication Publication Date Title
Shi et al. Text extraction from gray scale historical document images using adaptive local connectivity map
JPS5837779A (ja) 文書処理装置
US6035064A (en) Apparatus and method for detecting and recognizing character line using simplified projection information
KR101021134B1 (ko) 지문의 방향 특징을 추출하는 장치 및 방법
JPH02306386A (ja) 文字認識装置
JPS62194590A (ja) 文字認識方式
JPS6285394A (ja) 文字認識装置
JPH0548510B2 (ja)
JPH0449148B2 (ja)
JP2894111B2 (ja) 光学式活字文字認識装置における認識結果の総合判定方式
JPH0564396B2 (ja)
JP3160458B2 (ja) 文字読取装置及び文字読取方法
JP3391223B2 (ja) 文字認識装置
Oza et al. Optical character extraction under different illumination conditions application in real time systems
JP2023034823A (ja) 画像処理装置、画像処理装置の制御方法およびプログラム
JP2564276B2 (ja) パタ−ン認識方法および装置
JP2832035B2 (ja) 文字認識装置
JPH0436431B2 (ja)
JP2578768B2 (ja) 画像処理方法
JP4218179B2 (ja) パターン検出装置及び方法
JPH01140274A (ja) 文字行認識方式
JPS61206089A (ja) ドツト表記文字の読取り方法
JPS58222384A (ja) フオント識別方式
JPS5837777A (ja) 活字/手書き識別方法
JPS6232587A (ja) 文字認識方式