JPS6238752B2 - - Google Patents

Info

Publication number
JPS6238752B2
JPS6238752B2 JP55083524A JP8352480A JPS6238752B2 JP S6238752 B2 JPS6238752 B2 JP S6238752B2 JP 55083524 A JP55083524 A JP 55083524A JP 8352480 A JP8352480 A JP 8352480A JP S6238752 B2 JPS6238752 B2 JP S6238752B2
Authority
JP
Japan
Prior art keywords
character
character pattern
processing means
pattern
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP55083524A
Other languages
English (en)
Other versions
JPS578880A (en
Inventor
Norihiro Hagita
Isao Masuda
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP8352480A priority Critical patent/JPS578880A/ja
Publication of JPS578880A publication Critical patent/JPS578880A/ja
Publication of JPS6238752B2 publication Critical patent/JPS6238752B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/182Extraction of features or characteristics of the image by coding the contour of the pattern
    • G06V30/1823Extraction of features or characteristics of the image by coding the contour of the pattern using vector-coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
本発明は、文字パターンの分類処理装置、特に
光電変換によつて得られた文字パターンを2値化
した文字パターンに対し、例えば手書き漢字のよ
うな多くの字種をもつ文字対象を効率よく分類す
るために、少なくとも全黒画素について探索した
文字パターンの各文字線の長さと方向との分布か
ら文字パターンの特徴を抽出し、入力文字パター
ンを分類する文字パターンの分類処理装置に関す
るものである。 従来、漢字を含む文字パターンの認識装置また
は分類装置としてマルチフオント印刷漢字を対象
として、2値化された文字パターンを外接枠で切
り出し、該手段によつて得られた文字パターンを
n個の粗い矩形のメツシユ領域に分割し、各メツ
シユ領域に存在する文字部の面積を計数し、これ
を文字の面積で規格化し、n次元の特徴ベクトル
パターンを作成し、既にたくわえておいた各文字
の特徴辞書テーブルとのマツチングをとり、文字
パターンの分類を行う方式が知られている。しか
しながら、この方式では各粗いメツシユ領域内に
含まれる文字部の面積のみを計数するため、たと
えばある粗いメツシユ領域内で文字面積が等しい
ものの、その領域内の文字線が一方のカテゴリで
は縦方向成分の文字線の一部であるのに対し、他
方のカテゴリでは横方向成分の文字線の一部であ
るというような、字種のちがいによる文字構造の
ちがいを区別できないまま分類してしまい、字種
の多い漢字等を含む文字対象においては効率のよ
い分類を実現しにくいという難点があつた。 また印刷漢字認識の認識方式として、文字パタ
ーン上の各メツシユ点を上下左右の4方向に走査
し、文字パターンの黒点に対して、その隣接点の
状態から文字線の局所形態を表わすコードとし
て、水平点コード(垂直方向の隣接点のみが白点
である時)、垂直点コード(水平方向の隣接点の
みが白点である時)、斜め点コード(垂直、水平
両方向の隣接点が白点である時)、内部点コード
(前記3種コード以外の時)の4種を割り当て、
これらの情報を認識手段に用いる方式がある。し
かしながら、この方式では、文字パターン内の各
黒点に前記した論理手段により文字線の4方向別
の属性を割り当てるため、様々な文字変形に対処
するため同一字種に対して数多くの特徴辞書テー
ブルを作成する必要があり、膨大な辞書を作成し
なくてはならないという難点がある。このため上
記いずれの方法についても、それのみでは手書き
漢字など変形の大きい文字集合には十分な分類を
行なうことが期待し難いものである。 本発明は、従来技術により2値化、位置及び大
きさの正規化、文字枠取り処理、平滑化を行つた
文字パターンの少なくとも全黒画素から例えば
00、45゜、90゜、135゜、180゜、225゜、270゜、
315゜の8方向のように複素方向に触手を伸ばし
た時に各方向別に連続する黒点数を計数して求め
られる方向寄与度をもとにして文字パターンを分
類する手段を具備する装置を提供し、多字種、多
種の手書き変形をもつた手書き漢字を含む手書き
文字パターンを効率よく分類することを目的とし
ている。以下、図面を用いて詳細に説明する。 第1図は、本発明による本字パターンの分類処
理装置の一実施例のブロツク図である。第1図に
おいて、回路1は記憶回路で、はじめに2値化さ
れた手書き文字パターンを記憶しておく回路であ
る。装置2はこの2値化された文字パターンを入
力し、例えば従来まで知られている重心と2次モ
ーメントを用いて位置及び大きさの正規化処理を
行う文字パターンの位置及び大きさの正規化処理
装置である。 装置3は、装置2によつて得られたN×Nメツ
シユの正規化文字パターンを入力し、手書き文字
の外郭付近で起きるストロークの極端なつき出し
に対処するため、重心を中心とする文字枠取り枠
Wメツシユの正方領域で文字を枠取りし、枠外に
はみ出した文字部を除去する枠取り処理装置であ
る。装置4は、装置3によつて得られた文字枠取
り後の文字パターンを入力し、文字線輪郭部分の
黒点の1メツシユの凹、凸をそれぞれ、うめるま
たは取り除く平滑化処理装置である。 装置5は、本発明の主要部をなす特徴抽出処理
装置で平滑化処理を行つた文字パターンを入力
し、該文字パターンの各黒点から水平軸方向を基
準にしてM方向(たとえば8方向の場合には0
゜、45゜、90゜、135゜、180゜、225゜、270゜、
315゜の8方向)に触手を伸ばした時に各方向別
に連続する黒点数を計数して、黒点の方向寄与数
を求め、この値を文字パターンの各文字線の長さ
と方向の分布を表わす特徴として抽出する特徴抽
出処理装置である。 装置6は、装置3で枠取りしてあるW×Wメツ
シユの領域内をP個の粗い正方メツシユ領域に等
分割し、各粗いメツシユ領域内に存在する各黒点
に対して、装置5によつて割り当てられたM方向
別の黒点連結長を粗い正方メツシユ領域内で平均
して得られる方向別の平均黒点連結長を当該粗い
メツシユ領域における特徴パターンとして抽出
し、これをもとに文字パターンを分類するための
特徴テーブルを作成し、該手段によつて作成した
特徴テーブルをもとに、すでにたくわえておいた
各文字の特徴辞書テーブルとマツチングをとり、
文字パターンの分類を行う分類処理装置である。 装置5の具体例として、8方向(0゜、45゜、
90゜、135゜、180゜、225゜、270゜315゜の8方
向でそれらの方向にそれぞれ1、2、3、4、
5、6、7、8の番号を付与する)に触手を伸ば
し、画素の方向寄与度を求め、文字パターンを分
類する場合を例にとつて説明する。 その第1の方法は以下の通りである。第k番目
の粗い正方メツチユ領域から得られる平均方向寄
与度を〓kで表わすと 〓k(a1、a2、……、a8k なるベクトルで表わされる。ここでa1、a2、…
…、a8は8方向それぞれの平均黒点連結長を表わ
す。従つて文字パターンの特徴ベクトル〓は 〓=(〓、〓、……、〓k、……、〓p) で表わされる。このようにして表わされる文字パ
ターンの特徴ベクトル〓の各要素を文字パターン
の特徴として特徴テーブルを作成し公知の識別関
数g〓を求め文字パターンを分類する。 次に第2の方法は以下の通りである。前記の第
k番目の粗い正方メツシユ領域から得られる平均
方向寄与度〓kにおいて、方向iの平均黒点連結
長を〓ikで表わすと文字パターンの方向iに関す
る特徴ベクトル〓iは 〓i=(ai1、ai2、……、aik、……、aip) で表わされる。このようにして表わされる各方向
別に方向iの特徴ベクトル〓iを文字パターンの
特徴として特徴テーブルを作成し識別関数
【式】を求め文字パターンを分 類するようにされる。 ここでg(〓i)は方向iについて(i±2)
MOD8方向の平行移動による位置補正つきの公知
の識別関数である。またtiは方向iの荷重値を
表わしている。 第2図に、回路1、装置2、装置3、装置4の
動作例を示す。第2図Aは回路1にはじめにたく
わえられている2値化された文字パターンの例で
ある。第2図Bは、第2図Aの文字パターンに対
し、装置2により位置及び大きさの正規化を行つ
た文字パターンの例である。第2図Cは第2図B
の文字パターンに対し、装置3により文字枠取り
処理を行つた文字パターンの例である。第2図D
は第2図Cの文字パターンに対し、装置4により
平滑化処理を行つた文字パターンの例である。 第3図は装置5の動作を説明する説明図を示
す。第3図AはW×Wメツシユの文字枠取り領域
内の各黒点から8方向別の黒点連結長の抽出を説
明するための図である。第3図Bは、第3図Aの
黒点8−1の部分における8方向別の黒点連結長
の分布を方向別に矢印の大きさで示したものであ
る。第3図Cは第3図Bと同様に第3図Aの黒点
8−2の部分における8方向別の黒点連結長の分
布を示したものである。第3図Dは第3図B,C
と同様に第3図Aの黒点8−3の部分における8
方向別の黒点連結長の分布を示したものである。 第4図は装置6の特徴パターン作成の動作を説
明する説明図を示す。第4図AはW×Wメツシユ
の文字枠取り領域内を装置6により粗い正方のメ
ツシユ領域9−1,9−2,……,9−16に1
6分割した例である。第4図Bは、第4図Aの粗
いメツシユ領域9−1内の各黒点に装置5によつ
て割り当てられた8方向別の黒点連結長を方向別
に平均して得られた8方向別の平均黒点連結長の
分布を示したものである。 また装置5に示した特徴抽出処理装置を用いる
ことによつて、たとえば第3図Cの8方向別の黒
点連結数の分布にみられるように第3図Aの黒点
8−2の部分が垂直方向の文字線と斜め左下りの
文字線と斜め右下りの文字線とが交叉する領域内
の黒点であることがわかるという利点だけでな
く、第3図Bと第3図Cの黒点連結数の分布のち
がいから第3図Aの黒点8−1と黒点8−3が水
平方向の文字線成分の端点付近の黒点であり、か
つ黒点8−1が水平方向文字線成分の左端点付近
の黒点、黒点8−3が水平方向文字線成分の右端
点付近の黒点であるといつた、さらに詳細な文字
の幾何学的特徴点を抽出できるという利点があ
る。これより、装置5に示した特徴抽出は幾何学
的特徴に着目する手書き漢字等の文字認識に有効
な手段となる。 以上説明したように本発明の文字パターン分類
処理装置によれば、文字パターン内の各黒点から
例えば0゜、45゜、90゜、135゜、180゜、225
゜、270゜、315゜の8方向のように複数方向に触
手を伸ばし各方向別の黒点連結数を計数するた
め、文字パターンの各文字線の長さと方向との分
布を簡易な手法で抽出でき、字種のちがいによつ
てその文字構造も多採に変化する漢字等を含む文
字対象を効率よく分類できるという利点をもつ。
【図面の簡単な説明】
第1図は本発明による文字パターンの分類処理
装置の一実施例ブロツク図、第2図は第1図の回
路1、装置2、装置3、及び装置4による処理の
態様を説明する説明図、第3図は本発明の主要部
である装置5の特徴抽出手段を説明するための説
明図、第4図は装置6に関する特徴パターン作成
の動作を説明する説明図を示す。 1は記憶回路、2は文字パターン正規化処理装
置、3は枠取り処理装置、4は平滑化処理装置、
5は文字パターンの特徴抽出処理装置、6は文字
パターンの分類処理装置。

Claims (1)

    【特許請求の範囲】
  1. 1 2値化された文字パターンに対して、文字部
    の位置及び大きさについて正規化処理を行う正規
    化処理手段と該正規化処理手段によつて得られた
    文字パターンを文字枠取り枠で枠取りする枠取り
    処理手段と該枠取り処理手段によつて得られた文
    字パターンに平滑化処理を行う平滑化処理手段と
    該平滑化処理手段によつて得られた文字パターン
    の少なくとも全黒画素から予め定めた複数の方向
    に触手を伸ばして各方向別に得られる黒点列の長
    さで与えられる方向寄与度を全黒画素についても
    とめる特徴抽出処理手段と、少なくとも該情報を
    利用して文字パターンを分類する分類処理手段と
    を具備することを特徴とする文字パターンの分類
    処理装置。
JP8352480A 1980-06-20 1980-06-20 Sorting processor of character pattern Granted JPS578880A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8352480A JPS578880A (en) 1980-06-20 1980-06-20 Sorting processor of character pattern

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8352480A JPS578880A (en) 1980-06-20 1980-06-20 Sorting processor of character pattern

Publications (2)

Publication Number Publication Date
JPS578880A JPS578880A (en) 1982-01-18
JPS6238752B2 true JPS6238752B2 (ja) 1987-08-19

Family

ID=13804860

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8352480A Granted JPS578880A (en) 1980-06-20 1980-06-20 Sorting processor of character pattern

Country Status (1)

Country Link
JP (1) JPS578880A (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58158777A (ja) * 1982-03-16 1983-09-21 Nec Corp 文字認識方式
KR100225112B1 (ko) 1992-09-28 1999-10-15 기시모토 마사도시 도트 코드 및 정보를 기록/재생하기 위한 도트 코드 및 정보의 기록/재생 시스템(dot code and information recording/reproducing system for recording/reproducing the same)
US6366699B1 (en) 1997-12-04 2002-04-02 Nippon Telegraph And Telephone Corporation Scheme for extractions and recognitions of telop characters from video data

Also Published As

Publication number Publication date
JPS578880A (en) 1982-01-18

Similar Documents

Publication Publication Date Title
Lehal et al. A Gurmukhi script recognition system
Kumar et al. A detailed review of feature extraction in image processing systems
Hangarge et al. Offline handwritten script identification in document images
US4556985A (en) Pattern recognition apparatus
JP2002024836A (ja) ディジタルイメージから表題を抽出する方法
CN111461131B (zh) 身份证号码信息识别方法、装置、设备及存储介质
US5841905A (en) Business form image identification using projected profiles of graphical lines and text string lines
Mitchell et al. Newspaper document analysis featuring connected line segmentation
Ziaratban et al. An adaptive script-independent block-based text line extraction
Chhabra et al. Detection of horizontal lines in noisy run length encoded images: The FAST method
Uddin et al. Bangladeshi vehicle digital license plate recognition for metropolitan cities using support vector machine
Dhandra et al. Global and local features based handwritten text words and numerals script identification
JP3923243B2 (ja) カラー文書画像からの文字抽出方法
JPS6238752B2 (ja)
Gan et al. A new approach to stroke and feature point extraction in Chinese character recognition
Lu et al. Automatic detection of document script and orientation
Srinivas et al. An overview of OCR research in Indian scripts
Okun et al. A survey of texture-based methods for document layout analysis
Huang et al. Text line extraction of curved document images using hybrid metric
Mohan et al. Handwritten character recognition: a comprehensive review on geometrical analysis
Mitchell et al. Document page segmentation based on pattern spread analysis
Ramteke et al. Automatic segmentation of content and noncontent based handwritten Marathi text document
JPH0159627B2 (ja)
JPH0425588B2 (ja)
JP3140079B2 (ja) 罫線認識方法及び表処理方法