JPS6321955B2 - - Google Patents

Info

Publication number
JPS6321955B2
JPS6321955B2 JP55105489A JP10548980A JPS6321955B2 JP S6321955 B2 JPS6321955 B2 JP S6321955B2 JP 55105489 A JP55105489 A JP 55105489A JP 10548980 A JP10548980 A JP 10548980A JP S6321955 B2 JPS6321955 B2 JP S6321955B2
Authority
JP
Japan
Prior art keywords
projection
pattern
character
origin
patterns
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP55105489A
Other languages
English (en)
Other versions
JPS5730086A (en
Inventor
Eiichiro Yamamoto
Hideaki Sugawara
Kyonori Myata
Yoshihisa Fujii
Koya Fujita
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP10548980A priority Critical patent/JPS5730086A/ja
Publication of JPS5730086A publication Critical patent/JPS5730086A/ja
Publication of JPS6321955B2 publication Critical patent/JPS6321955B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/184Extraction of features or characteristics of the image by analysing segments intersecting the pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 本発明は、文字認識処理方式、特に例えば漢字
などの如く多数のストロークによつて構成されて
いる文字図形から安定した特徴を抽出して文字の
認識を行なうようにする文字認識処理方式に関す
るものである。
従来の文字認識処理方式における特徴抽出手段
としては、認識文字パターンを縦および横の2方
向に走査し、文字線部を1走査毎に計数した縦方
向投影パターンと横方向投影パターンとを生成し
て特徴パターンとしたものがある。即ち、例えば
第1図に図示されている如く、認識文字パターン
1を縦方向に走査して文字線部の黒ドツト数を1
走査毎に計数して得られた縦方向投影パターン2
と、同様に横方向に走査して得られた横方向投影
パターン3とを特徴パターンとしている。かくの
如き従来の文字認識方式は、認識されるべき文字
が印刷文字のように文字線幅が比較的に安定して
いる文字であるような場合には或る程度有効であ
る。しかしながら、例えば手書き文字のように文
字線幅の変動が大きい文字の場合には、上記の従
来の文字認識方式によつて安定した特徴パターン
を得ることは難かしい。また、漢字の如き複雑な
文字を認識するに当つて、従来の文字認識方式の
如く、縦方向と横方向との2種類の投影パターン
のみによる特徴パターンでは充分でない。
本発明は、上記の如き考察にもとづくものであ
つて、認識文字パターン領域内の任意の点を、即
ち後述する如く辞書部に格納されている標準パタ
ーンを得るに当つて選定された投影原点に相当す
る点を、認識処理に当つての投影原点に選び、該
投影原点において交差する少なくとも2本の直線
をもつて投影軸となし、該夫々の投影軸によつて
2分割される夫々の上記パターン領域のストロー
ク計数による投影パターンをもつて特徴パターン
を生成することによつて、文字認識効果を高める
ことを可能とする文字認識処理方式を提供するこ
とを目的としている。そしてそのため、本発明の
文字認識処理方式は、認識文字パターンを少なく
とも2つの座標軸に対して投影して該投影された
投影パターンにもとづいて認識処理を行なう文字
認識処理方式において、1つの投影原点を交差す
る少なくとも2つの座標軸を選ぶと共に該夫々の
座標軸によつて分割される一方の領域内のパター
ンと他方の領域内のパターンとを夫々別々に上記
座標軸上にストローク個数の形で投影するよう構
成し、上記各座標軸上別々に投影されたストロー
ク個数投影パターンをもつて上記認識文字パター
ンの特徴として抽出して認識処理を行なうことを
特徴としている。以下図面を参照しつつ説明す
る。
第2図は本発明の文字認識処理方式における特
徴抽出に関する説明図、第3図は本発明の一実施
例構成を示すブロツク図、第4図Aは第3図図示
実施例を説明するための説明図、第4図Bは第4
図A図示矢印B部分の拡大図を示している。
本発明における認識文字の特徴抽出即ち特徴パ
ターンを構成する投影パターンについて説明する
ための第2図において、図中の符号1は認識文字
パターン、4は投影原点、5ないし8は投影軸で
あつて、5は横方向、6は縦方向、7は右斜方向
および8は左斜方向の各投影軸を表わし、更に、
5−1および5−2は第1および第2の投影パタ
ーンで投影軸5に対する投影パターン、6−1お
よび6−2は第3および第4の投影パターンであ
つて投影軸6に対する投影パターン、7−1およ
び7−2は第5および第6の投影パターンであつ
て投影軸7に対する投影パターン、8−1および
8−2は第7および第8の投影パターンであつて
投影軸8に対する投影パターンを夫々表わしてい
る。
先づ、本発明における特徴パターンを構成する
投影パターンについて第2図図示説明図を参照し
て説明する。第2図は、任意の位置に投影原点4
を設定し、該投影原点4において互いに交差する
例えば4本の投影軸5ないし8が設定されて、該
投影軸5ないし8に対する認識文字パターンの第
1の投影パターン5−1ないし第8の投影パター
ン8−2が生成された実施例が示されている。な
お、本発明はこれに限定されるものでなく2本の
投影軸即ち上記投影軸5および6による第1の投
影パターン5−1ないし第4の投影パターン6−
2によつて特徴パターンを構成しても悪くはない
が、第2図図示の如く8個の投影パターンによつ
て特徴パターンを構成する方が認識文字パターン
1の特徴抽出を一層効果的にすることは勿論であ
る。また上記図示の投影原点4は、認識文字パタ
ーン1の右端に選んだ形として示されているが、
言うまでもなく、標準パターンを得るに当つて選
定された投影原点に対応する形で選ばれていれば
よい。通常では、認識文字パターン1を囲う四辺
形を切出して、その重心を投影原点にするのが一
般的であり、そのように選んでもよい。
上記投影軸5に対する第1および第2の投影パ
ターン5−1および5−2の抽出は、投影軸5に
対して直角方向に認識文字パターン1を走査し、
背景部分(例えば白)から文字部分(例えば黒)
への変化点を計数することによつて第1の投影パ
ターン5−1が抽出される。即ち、該第1の投影
パターン5−1において図示aおよびcの範囲に
おいては上記変化点は1箇所検出され、図示bの
範囲においては上記変化点が3箇所検出されるこ
とにより図示の如き第1の投影パターン5−1が
抽出されることになる。また、上記投影軸5の右
側には文字線部が存在しないため第2の投影パタ
ーン5−2は現われない。同様にして、投影軸6
ないし8に対する第3の投影パターン6−1ない
し第8の投影パターン8−2が抽出される。この
ようにして得られた第1の投影パターン5−1な
いし第8の投影パターン8−2の特徴パターンを
後述する辞書部に予め格納されている標準特徴パ
ターンと照合することによつて、上記認識文字パ
ターン1を文字「木」と認識する。なお、以上説
明した本発明の文字認識処理方式における上記第
1の投影パターン5−1ないし第8の投影パター
ン8−2の抽出に当つては、上記認識文字パター
ン1に対して一方向のみの走査によつて抽出する
ことができる。
次に、本発明における上記認識文字パターン1
の走査から認識までの過程を第3図に図示されて
いる本発明の一実施例構成を示すブロツク図およ
び該ブロツク図を説明するための第4図A,Bを
参照して説明する。第3図および第4図A,Bに
おける符号9および10はシフト・レジスタ、1
1は一行遅延回路、12−1ないし12−4はノ
ツト回路、13−1ないし13−4はオア回路、
14−1ないし14−4はアンド回路、15−1
ないし15−4はワンシヨツト・マルチであつて
入力が「1」から「0」に変化する際に「1」を
ワンシヨツト出力するもの、16−1ないし16
−4はノツト回路、17−1ないし17−8はア
ンド回路、18−1ないし18−8は第1ないし
第8投影パターン・カウンタ群であつて、第1の
投影パターン・カウンタ群18−1は第2図図示
例における第1の投影パターン5−1に対応する
カウンタ群即ち投影軸5に対しかつ該投影軸5の
左側部分の特徴を抽出するものであり、同様にし
て第2ないし第8の投影パターン・カウンタ群は
第2図図示第2ないし第8の投影パターンに対応
するもの、19はアドレス生成部、20は行アド
レス・カウンタであつて行アドレス(例えば第4
図A図示行アドレスj)をカウントするもの、2
1は行原点アドレス・レジスタであつて投影原点
の行アドレス(例えば第4図A図示の認識文字パ
ターン1の存在位置から決定された図示投影原点
4の行アドレスb)を格納するもの、22は列ア
ドレス・カウンタであつて列アドレス(例えば第
4図A図示列アドレスi)をカウントするもの、
23は列原点アドレス・レジスタであつて投影原
点の列アドレス(例えば第4図A図示投影原点4
の列アドレスa)を格納するもの、24および2
5は演算器であつて、演算器24は列アドレス・
カウンタ22の内容(i)と行アドレス・カウンタ2
0の内容(j)と(−1)との加算即ち(i+j−
1)の演算を行なうものであり、演算器25は上
記列アドレス・カウンタ22の内容(i)から上記行
アドレス・カウンタ20の内容(j)を減算して行ア
ドレスの最大値(J)を加算する演算即ち(i−j+
J)なる演算を行なうもの、26および27は
夫々レジスタであつて、レジスタ26は投影原点
の列アドレス(a)と行アドレス(b)と(−1)との加
算値即ち(a+b−1)の値がセツトされるもの
であり、レジスタ27は投影原点の列アドレス(a)
から行アドレス(b)を減算して行アドレスの最大値
(J)を加算した値即ち(a−b+J)の値をセツト
するもの、28ないし31は比較器であつて比較
内容が一致するまでは「1」一致後は「0」を出
力するもの(例えば比較回路28においては、行
アドレス・カウンタ20の内容が行原点アドレ
ス・レジスタ21にセツトされている値(b)に一致
するまでは「1」を出力し、それ以後は「0」を
出力する。その他の比較器29ないし31も同様
である)、32は特徴パターン・レジスタ、33
は辞書部であつて後述する本発明と同じ手段によ
つて予め作成された標準パターンが格納されてい
るもの、34は認識部であつて上記特徴パター
ン・レジスタ32の内容を辞書部33に予め格納
されている標準パターンと照合して文字認識を行
なうもの、35は文字領域、36は走査マスクを
夫々表わしている。
第3図において、シフト・レジスタ9に画像信
号が入力される。該画像信号は、認識文字を水平
に走査して、背景部分(白)を「0」、文字線部
分(黒)を「1」として送られてくる。即ち、例
えば、第4図A図示の如く認識の対象となる文字
が「亜」である場合、文字「亜」の存在する文字
領域35を水平方向に走査することによつて背景
部分は「0」、認識文字パターン1の部分は「1」
が画像信号として順次シフト・レジスタ9に送ら
れてくる。そして、該シフト・レジスタ9に入力
された画像信号は1行遅延回路11を介してシフ
ト・レジスタ10に送られる結果、上記シフト・
レジスタ9の出力端子,およびシフト・レジ
スタ10の出力端子,,からは、恰も第4
図A図示矢印Bにおける走査マスク36即ち第4
図B図示の走査マスク36をもつて走査したと同
様な画像信号が出力される。なお、上記マスク3
6内に記入されている数字は上記出力端子ない
しに対応している。
先づ、アンド回路14−1において、上記シフ
ト・レジスタ9の出力端子からの信号即ち第4
図図示の走査マスク36の窓1における画像信号
とノツト回路12−1およびオア回路13−1を
介して送られてくる上記シフト・レジスタ9の出
力端子からの信号即ち上記走査マスク36の窓
2における画像信号の反転信号との論理積がとら
れる。従つて、上記アンド回路14−1の出力が
「1」となるのは、上記出力端子の出力が「1」
かつ上記出力端子の出力が「0」になつた場合
即ち第4図B図示走査マスク36の窓1において
認識文字パターン1を検出し、かつ窓2において
背景の白を検出した場合である。即ち、文字領域
35の走査方向に一致する方向(第4図における
横方向)における白から黒への変化を検出して上
記アンド回路14−1は「1」を出力する。そし
て、該アンド回路14−1の出力は、アンド回路
17−1および17−2に送られて、アンド回路
17−1においては比較回路28の出力信号と、
またアンド回路17−2においては比較回路28
の出力反転信号(ノツト回路16−1によつて反
転されるため)との論理積が取られる。そして、
上記アンド回路17−1の出力は第1の投影パタ
ーン・カウンタ群18−1の、またアンド回路1
7−2の出力は第2の投影パターン・カウンタ群
18−2の、夫々行アドレス・カウンタ20の内
容に対応づけられたアドレスのカウンタにおいて
計数される。なお、上記第1および第2の投影パ
ターン・カウンタ群18−1および18−2は第
4図Aに図示されているように1番地からJ番地
までのアドレスが割当てられているものと考えて
よい。以上説明したことによつて明かなように第
1の投影パターン・カウンタ群には第4図図示例
における文字領域35内の投影軸5の左側部にお
いて横方向に行アドレス(j)対応に存在するストロ
ークの本数がセツトされる。また、第2の投影パ
ターン・カウンタ群には投影軸5の右側部のスト
ロークの本数がセツトされる。なお、上記の説明
では、上記文字領域35の投影軸5の右側部に存
在するストロークが左側部から連続しているもの
であれば上記第2の投影パターン・カウンタ群1
8−2においてカウントされないことになる。従
つて、ワンシヨツト・マルチ15−1およびオア
回路13−1をもうけることによつて、上記投影
軸5の左側部から連続して存在する右側部のスト
ロークも上記第2の投影パターン・カウンタ群1
8−2において計算できるように構成されてい
る。
以下、第3ないし第8の投影パターン・カウン
タ18−3ないし18−8における内容も上記第
1および第2の投影パターン・カウンタ群18−
1および18−2と同様にセツトされるものであ
るため説明を省略する。
このようにして得られた上記第1ないし第8の
投影パターン・カウンタ群18−1ないし18−
8にセツトされた内容は、第2図または第4図A
図示の如く、認識文字パターン1における8方向
の特徴抽出結果であるため、上記第1ないし第8
の投影パターン・カウンタ群8−1ないし18−
8の内容から特徴パターン・レジスタ32におい
て構成される特徴パターンが、辞書部33に予め
格納されている標準パターンと、認識部34にお
いて照合されて認識効果の高い認識結果を得るこ
とが出来る。
以上説明した如く、本発明によれば、認識文字
パターン領域内に投影原点をもうけ、該投影原点
において交差する少なくとも2本の直線をもつて
投影軸となし、該夫々の投影軸によつて2分割さ
れる上記認識文字パターン領域の夫々の領域に存
在するストローク計数による投影パターンをもつ
て特徴パターンとして文字認識を行なうようにす
るため、文字認識効果の高い文字認識処理方式を
提供することが出来る。そしてそのため、手書き
文字の如き文字線幅の大きい文字、または漢字の
如きストロークが多くて複雑な文字においても正
確に文字認識を行なうことが出来る。また認識文
字が漢字などの場合“へん”や“つくり”などで
構成されるが、上記投影原点の位置を選ぶことに
よつて、“へん”と“つくり”とを投影軸によつ
て分離した上で夫々の特徴を抽出できる利点があ
り、漢字認識などにおいて有利である。
【図面の簡単な説明】
第1図は従来の文字認識処理方式における特徴
抽出手段を説明するための説明図、第2図は本発
明における特徴抽出手段を説明するための説明
図、第3図は本発明の一実施例構成を示すブロツ
ク図、第4図A,Bは第3図図示実施例を説明す
るための説明図である。 図中、1は認識文字パターン、4は投影原点、
5ないし8は投影軸、5−1ないし8−2は投影
パターン、9および10はシフト・レジスタ、1
1は一行遅延回路、12−1ないし12−4およ
び16−1ないし16−4はノツト回路、13−
1ないし13−4はオア回路、14−1ないし1
4−4および17−1ないし17−8はアンド回
路、18−1ないし18−8は第1ないし第8の
投影パターン・カウンタ群、19はアドレス生成
部、20は行アドレス・カウンタ、21は行原点
アドレス・レジスタ、22……列アドレス・カウ
ンタ、23は列原点アドレス・レジスタ、24お
よび25は演算器、26および27はレジスタ、
28ないし31は比較器、32は特徴パターン・
レジスタ、33は辞書部、34は認識部を夫々表
わす。

Claims (1)

    【特許請求の範囲】
  1. 1 認識文字パターンを少なくとも2つの座標軸
    に対して投影して該投影された投影パターンにも
    とづいて認識処理を行なう文字認識処理方式にお
    いて、1つの投影原点を交差する少なくとも2つ
    の座標軸を選ぶと共に該夫々の座標軸によつて分
    割される一方の領域内のパターンと他方の領域内
    のパターンとを夫々別々に上記座標軸上にストロ
    ーク個数の形で投影するよう構成し、上記各座標
    軸上別々に投影されたストローク個数投影パター
    ンをもつて上記認識文字パターンの特徴として抽
    出して認識処理を行なうことを特徴とする文字認
    識処理方式。
JP10548980A 1980-07-31 1980-07-31 Character recognition processing system Granted JPS5730086A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10548980A JPS5730086A (en) 1980-07-31 1980-07-31 Character recognition processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10548980A JPS5730086A (en) 1980-07-31 1980-07-31 Character recognition processing system

Publications (2)

Publication Number Publication Date
JPS5730086A JPS5730086A (en) 1982-02-18
JPS6321955B2 true JPS6321955B2 (ja) 1988-05-10

Family

ID=14409001

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10548980A Granted JPS5730086A (en) 1980-07-31 1980-07-31 Character recognition processing system

Country Status (1)

Country Link
JP (1) JPS5730086A (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0659164B2 (ja) * 1985-12-23 1994-08-10 理研ビタミン株式会社 ステリン含有組成物
US5245674A (en) * 1991-07-30 1993-09-14 Xerox Corporation Image processing using distance as a function of direction
US5253307A (en) * 1991-07-30 1993-10-12 Xerox Corporation Image analysis to obtain typeface information

Also Published As

Publication number Publication date
JPS5730086A (en) 1982-02-18

Similar Documents

Publication Publication Date Title
KR880002662B1 (ko) 문자 인식장치
US5075895A (en) Method and apparatus for recognizing table area formed in binary image of document
US5668892A (en) Table recognition apparatus
JPH0420226B2 (ja)
JPS6321955B2 (ja)
JP7075770B2 (ja) 文字認識システム、文字鮮明化システム、文字鮮明化プログラム、文字鮮明化方法、及び文字鮮明化画像の表示装置
JP2000113111A (ja) イメージ認識用特徴値抽出方法、およびその装置、イメージ解析プログラムを格納する記憶媒体
JPH06187489A (ja) 文字認識装置
JPS6019285A (ja) ストロ−ク抽出方法
JPH0877355A (ja) 重み付きパターンマッチング方法
JP2888885B2 (ja) 文字切出し装置
JP2988801B2 (ja) 宛名認識装置
JP2844618B2 (ja) 文字切り出し装置
JPS622382A (ja) 画像処理方法
JPS5830621B2 (ja) 交差点検出方式
JPH05108882A (ja) 文字認識装置
JPH05128309A (ja) 文字認識におけるエツジ検出方法
KR910009929B1 (ko) 문서인식을 위한 문서영역 추출방법
JPS58223884A (ja) 文字パタ−ンの分類処理装置
JPH0765125A (ja) 文字配列が既知の対象文字列の認識装置
JPS6019287A (ja) 文字認識方法
JPH02166583A (ja) 文字認識装置
JPH0266681A (ja) 図面処理装置
JPH09167205A (ja) 文字パターン抽出方法
JPS5894067A (ja) 文字認識方法