JPH01183793A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH01183793A
JPH01183793A JP63007930A JP793088A JPH01183793A JP H01183793 A JPH01183793 A JP H01183793A JP 63007930 A JP63007930 A JP 63007930A JP 793088 A JP793088 A JP 793088A JP H01183793 A JPH01183793 A JP H01183793A
Authority
JP
Japan
Prior art keywords
vector
similarity
pattern
character
composite similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63007930A
Other languages
English (en)
Inventor
Bunpei Irie
文平 入江
Haruo Asada
麻田 治男
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP63007930A priority Critical patent/JPH01183793A/ja
Priority to US07/294,649 priority patent/US4977603A/en
Publication of JPH01183793A publication Critical patent/JPH01183793A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/18086Extraction of features or characteristics of the image by performing operations within image blocks or by using histograms
    • G06V30/18095Summing image-intensity values; Projection and histogram analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は文字認識装置に関わり、特に複合類似度法を用
いて文字を認識する文字認識装置に関する。
(従来の技術) 従来より、文字認識の認識手法の一つとして複合類似度
法が知られている。この複合類似度法は、入力文字の濃
度パターンベクトルVと標準文字パターンから定められ
たn個の直交ベクトルR1(i−1〜n)とを、 (klは係数) なる複合類似度演算により評価するもので、入力文字パ
ターンと標準パターンとの間の本質的でない変形、例え
ば位置ずれ等を無視できるようにしたものである。この
複合類似度法によれば、文字の位置ずれや変形を良く吸
収し、高い認識率が得られることが知られている。
しかしながら、認識対象が例えば手書き文字である場合
のように、入力文字が複雑かつ多様な変形を受ける場合
には、上記の複合類似度法を用いた文字認識でも十分な
認識結果を得ることができないという問題がある。即ち
、上述した従来の複合類似度法は、基本的には標準パタ
ーンや入カバターンといった濃度パターン間の相関値を
比較するもので−あるため、文字の持つ構造的な特徴を
比較するものではない。このため、認識の条件が厳しく
なると、必ずしも満足できる認識結果が得られないとい
う問題があった。
(発明が解決しようとする課題) このように、従来の複合類似度法を用いた文字認識装置
では、文字の構造的特徴を十分に反映していないために
、文字が複雑かつ多様な変形を受けたときに十分な認識
結果が得られないという問題があった。
本発明はかかる問題点に鑑みなされたもので、複合類似
度法による認識において、文字の構造的特徴を十分に反
映することが可能であり、認識性能を大幅に向上させる
ことができる文字認識装置を提供することを目的とする
[発明の構成コ (課題を解決するための手段) 本発明は、入力二値画像中から互いに隣接する2×2ド
ツトで構成される所定の近傍パターンを抽出する手段と
、この手段で抽出された上記近傍パターンの前記入力二
値画像を分割した部分領域毎の頻度と前記入力二値画像
のサイズとに基づいて特徴ベクトルを生成する手段と、
この手段で生成された特徴ベクトルと辞書ベクトルとを
複合類似度演算して類似度を求める手段と、この手段で
求められた類似度から文字認識結果を判定する手段とを
具備したことを特徴としている。
(作用) 本発明によれば、2X2近傍パターンのうちの所定のパ
ターンを抽出することにより、濃度特徴のみならず文字
の構造的特徴を抽出することができるので、従来の複合
類似度法による認識手法に文字の構造的な評価を反映さ
せることができる。
従って、本発明によれば、文字認識率を大幅に向上させ
ることができる。
(実施例) 以下、図面を参照して本発明の一実施例について説明す
る。
第1図は本発明の一実施例に係る文字認識装置の概略構
成を示すブロック図である。第1図において、入力文字
が記述された文書10は、光電変換素子等から構成され
る文字入力部11で電気的な二値画像データに変換され
る。文字入力部11で得られた二値画像データのうちの
文字の部分は、1文字ずつ文字切出部12において検出
され切出される。文字切出部12で切出された文字パタ
ーンは、特徴抽出部13に入力されている。この特徴抽
出部13は、2×2近傍パタ一ン抽出部21と、ベクト
ル算出部22と、正規化部23とにより構成されており
、入カバターンから2X2ドツトで構成される近傍パタ
ーンを抽出し、これら近傍パターンのうちの特定のパタ
ーンの位置(入力二値画像の分割ブロック)毎の頻度情
報に基づいて特徴ベクトルを算出する。この特徴抽出部
13で抽出された特徴ベクトルは、複合類似計算部14
に与えられている。複合類似度計算部14では、認識辞
@15に格納された標準ベクトルと、上記抽出された特
徴ベクトルとを複合類似度演算して各カテゴリについて
の複合類似度値を求める。
これら複合類似度値は、認識結果判定部16に与えられ
、ここで認識結果が判定され出力部17を介して出力さ
れる。
次に、上記のように構成された本実施例に係る文字認識
装置の作用を説明する。
いま、例えば第2図のようなパターン“ア”が文字入力
部11に入力され、文字切出部12で切出されたとする
と、このパターンは、2×2近傍パタ一ン抽出部21に
おいて、先ず3×3の9つのブロックに分割される。そ
して、各ブロックについて、第3図に示すような16通
りの2×2近傍パターンpt−plBの頻度が求められ
る。この頻度を示したのが第3図の各欄右端に示した9
次元のベクトルである。例えばp4のパターンについて
着目すると、これは第2図の中央のブロックに最も多く
出現しているので、この中央のブロックに縦長エツジ成
分が多く含まれてい木という構造的特徴を把握すること
ができる。
次にベクトル算出部22は、これら16通りのパターン
pt−piBの頻度ベクトルから第4図に示すような9
次元のベクトルW1〜W4を算出する。いま、第3図の
各欄の右端に表示されている9次元のベクトルを抽出ベ
クトルと呼ぶことにすると、ベクトルwlは、p6及び
pHの抽出ベクトルに重み1をかけるとともに他のパタ
ーンの抽出ベクトルに重み0をかけて各抽出ベクトルの
要素同士をかけ合せて算出される。ベクトルW2は、p
2及びp9の抽出ベクトルに重み1をかけるとともに他
のパターンの抽出ベクトルに重み0をかけて各抽出ベク
トルの要素同士をかけ合せて算出される。ベクトルW3
は、p4及びp13の抽出ベクトルに重み1をかけると
ともに他のパターンの抽出ベクトルに重み0をかけて各
抽出ベクトルの要素同士をかけ合せて算出される。ベク
トルW4は、p3及びp5の抽出ベクトルに重み1をか
けるとともに他のパターンの抽出ベクトルに重みOをか
けて各抽出ベクトルの要素同士をかけ合せて算出される
。つまり、ベクトルWl 、  w’l 、  w3 
w4はそれぞれ入力文字パターンの構成分、右上り傾斜
成分、縦成分、左上り傾斜成分の各ブロックにおける頻
度を示すベクトルとなっている。
正規化部23は、これら9次元のベクトルW1〜w4を
ブロックの面積7X7−49で割って正規化し、第5図
に示すような4X9−36次元の特徴ベクトルVを算出
する。
類似度計算部14では、得られた上記特徴ベクトルVと
、認識辞書1゛5に格納されたm個の互いに直交したベ
クトルからなる標準ベクトルr1(i−1〜m)との複
合類似度値を、各カテゴリについて、 なる複合類似演算によって求め、その結果を認識結果判
定部16に出力する。
認識結果判定部16では、複合類似度計算部14で求め
られた各カテゴリについての類似度値から認識文字を同
定17て出力部17に出力する。
このように本実施例によれば、位置ずれに強い複合類似
度法に提供する特徴ベクトルとして文字の構造的特徴を
含む2×2近傍パターンにより求められた特徴ベクトル
を用いているので、文字の多様な変形に対しても高い認
識率を得ることができる。
なお、本発明は上述した実施例に限定されるものではな
い。例えば上記実施例で採用した各ベクトルの次元数、
ブロック数、重み係数等は様々な値に設定可能である。
特に第3図に示した16種類の2×2近傍パターンにつ
いて、それぞれの抽出ベクトルにそのパターンの黒ドツ
トの数を係数として乗じたベクトルを用いれば、黒ドツ
トの面積をも考慮したノイズの影響の少ない特徴を抽出
できる。また、上記の例では、入カバターンを先ず3X
3−9個の重なりのない長方形ブロックに分割し、それ
ぞれのブロック内に含まれる2×2パターンを単純に重
み1で加えたが、ブロックは必ずしも長方形にする必要
はなく、またブロック同士に重なりを持たせるようにし
ても良い。また、認識領域内での位置に応じて重みを変
え、2X2パターンの個数を総計することも考えられる
。更には、同一の特徴ベクトルを求めるのにも複数の方
法が可能で、例えば輪郭に関わる2X2近傍パターンの
みを抽出するためには、入力二値画像の全域を調べる必
要はなく、輪郭を追跡しながら累積操作を行なっても良
い。
また、類似度計算の方法についも、特徴ベクトルと標準
パターンとの内積の二乗を算出し、これに基づいて類似
度を求める複合類似度法を基本とするものであれば、他
の改善された計算方法を採用することも可能である。
[発明の効果] 以上述べたように、本発明によれば、2×2近傍特徴抽
出によって、文字の構造的特徴を含む有効な特徴量を算
出したうえで、変形に対して安定な複合類似度法を用い
て文字認識を行なうので、高い文字認識率を得ることが
可能である。
【図面の簡単な説明】
第1図は本発明の一実施例に係る文字認識装置のブロッ
ク図、第2図は同装置に入力される入カバターンの一例
を示す図、第3図は同装置における2X2近傍パタ一ン
抽出部で抽出されるパターンと抽出されたベクトルとを
示す図、第4図は同装置におけるベクトル算出部で算出
されたベクトルを示す図、第5図は同装置における正規
化部で求められた特徴ベクトルを示す図である。 11・・・文字人力部、12・・・文字切出し部、13
・・・特徴抽出部、14・・・複合類似度計算部、15
・・・認識辞書、16・・・認識結果判定部、17・・
・出力部、21・・・2×2近傍パタ一ン抽出部、22
・・・ベクトル算出部、23・・・正規化部。 出願人代理人 弁理士 鈴江武彦 第3図

Claims (1)

    【特許請求の範囲】
  1. 入力二値画像中から互いに隣接する2×2ドットで構成
    される所定の近傍パターンを抽出する手段と、この手段
    で抽出された上記近傍パターンの前記入力二値画像を分
    割した部分領域毎の頻度と前記入力二値画像のサイズと
    に基づいて特徴ベクトルを生成する手段と、この手段で
    生成された特徴ベクトルと辞書ベクトルとを複合類似度
    計算して類似度を求める手段と、この手段で求められた
    類似度から文字認識結果を判定する手段とを具備したこ
    とを特徴とする文字認識装置。
JP63007930A 1988-01-08 1988-01-18 文字認識装置 Pending JPH01183793A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP63007930A JPH01183793A (ja) 1988-01-18 1988-01-18 文字認識装置
US07/294,649 US4977603A (en) 1988-01-08 1989-01-09 Method and apparatus for a pattern recognition

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63007930A JPH01183793A (ja) 1988-01-18 1988-01-18 文字認識装置

Publications (1)

Publication Number Publication Date
JPH01183793A true JPH01183793A (ja) 1989-07-21

Family

ID=11679242

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63007930A Pending JPH01183793A (ja) 1988-01-08 1988-01-18 文字認識装置

Country Status (2)

Country Link
US (1) US4977603A (ja)
JP (1) JPH01183793A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5790701A (en) * 1994-06-06 1998-08-04 Kabushiki Kaisha Toshiba Character recognition apparatus using edge images

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE68928703T2 (de) * 1988-07-20 1998-12-10 Fujitsu Ltd Buchstabenerkennungsvorrichtung
US5625710A (en) * 1988-07-20 1997-04-29 Fujitsu Limited Character recognition apparatus using modification of a characteristic quantity
DE69027469T2 (de) * 1989-03-20 1996-11-14 Hitachi Ltd Optisches Aufzeichnungssystem
JPH087785B2 (ja) * 1989-05-16 1996-01-29 松下電器産業株式会社 2値化処理装置
US5151951A (en) * 1990-03-15 1992-09-29 Sharp Kabushiki Kaisha Character recognition device which divides a single character region into subregions to obtain a character code
JPH0481988A (ja) * 1990-07-24 1992-03-16 Sharp Corp クラスタリング方式
US5390259A (en) * 1991-11-19 1995-02-14 Xerox Corporation Methods and apparatus for selecting semantically significant images in a document image without decoding image content
CA2077970C (en) * 1991-11-19 1999-02-23 Daniel P. Huttenlocher Optical word recognition by examination of word shape
US5321770A (en) * 1991-11-19 1994-06-14 Xerox Corporation Method for determining boundaries of words in text
CA2077969C (en) * 1991-11-19 1997-03-04 Daniel P. Huttenlocher Method of deriving wordshapes for subsequent comparison
JP3576570B2 (ja) * 1991-11-19 2004-10-13 ゼロックス コーポレイション 比較方法
US5422961A (en) * 1992-04-03 1995-06-06 At&T Corp. Apparatus and method for improving recognition of patterns by prototype transformation
US5325445A (en) * 1992-05-29 1994-06-28 Eastman Kodak Company Feature classification using supervised statistical pattern recognition
JP3244798B2 (ja) * 1992-09-08 2002-01-07 株式会社東芝 動画像処理装置
IT1265673B1 (it) * 1993-03-22 1996-11-22 Texas Instruments Italia Spa Apparecchio e procedimento per il riconoscimento di caratteri manoscritti.
JPH0749927A (ja) * 1993-08-09 1995-02-21 Nireco Corp パターン認識方法
US5875264A (en) * 1993-12-03 1999-02-23 Kaman Sciences Corporation Pixel hashing image recognition system
JP3445394B2 (ja) * 1993-12-17 2003-09-08 ゼロックス・コーポレーション 少なくとも二つのイメージセクションの比較方法
US5410611A (en) * 1993-12-17 1995-04-25 Xerox Corporation Method for identifying word bounding boxes in text
IT1268059B1 (it) * 1994-05-20 1997-02-20 Mini Ricerca Scient Tecnolog Procedimento di estrazione caratteristiche di un'immagine digitale binaria.
JP3095623B2 (ja) * 1994-06-16 2000-10-10 松下電器産業株式会社 属性判定方法
US5642288A (en) * 1994-11-10 1997-06-24 Documagix, Incorporated Intelligent document recognition and handling
IL113204A (en) * 1995-03-30 1999-03-12 Advanced Recognition Tech Pattern recognition system
US5664174A (en) * 1995-05-09 1997-09-02 International Business Machines Corporation System and method for discovering similar time sequences in databases
US5778095A (en) * 1995-12-20 1998-07-07 Xerox Corporation Classification of scanned symbols into equivalence classes
US5818965A (en) * 1995-12-20 1998-10-06 Xerox Corporation Consolidation of equivalence classes of scanned symbols
US5835638A (en) * 1996-05-30 1998-11-10 Xerox Corporation Method and apparatus for comparing symbols extracted from binary images of text using topology preserved dilated representations of the symbols
KR100344530B1 (ko) * 1999-12-20 2002-07-24 한국과학기술원 시계열 데이터베이스에서 윈도우 구성의 이원성을 사용한 서브시퀀스 매칭방법
JP2006148578A (ja) * 2004-11-19 2006-06-08 Sharp Corp 画像処理装置、画像読取装置、及び画像記録装置
FI121901B (fi) * 2008-10-17 2011-05-31 Visidon Oy Objektien ilmaiseminen ja seuraaminen digitaalisissa kuvissa
US9158983B2 (en) 2010-07-08 2015-10-13 E-Image Data Corporation Microform word search method and apparatus
US10169684B1 (en) * 2015-10-01 2019-01-01 Intellivision Technologies Corp. Methods and systems for recognizing objects based on one or more stored training images

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1180290A (en) * 1966-10-31 1970-02-04 Tokyo Shibaura Electric Co Apparatus for Recognising a Pattern
JPS4912778B1 (ja) * 1969-11-05 1974-03-27
JPS5619656B2 (ja) * 1973-08-08 1981-05-08
JPS57136000A (en) * 1981-02-17 1982-08-21 Nippon Electric Co Pattern matching apparatus
JPS57178578A (en) * 1981-04-27 1982-11-02 Toshiba Corp Pattern recognition system
US4521773A (en) * 1981-08-28 1985-06-04 Xerox Corporation Imaging array
US4543660A (en) * 1982-04-15 1985-09-24 Tokyo Shibaura Denki Kabushiki Kaisha Pattern features extracting apparatus and method
JPS5987448A (ja) * 1982-11-11 1984-05-21 Fuji Photo Film Co Ltd カラ−フイルム検定方法
JPS6173477A (ja) * 1984-09-19 1986-04-15 Minolta Camera Co Ltd 画像処理方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5790701A (en) * 1994-06-06 1998-08-04 Kabushiki Kaisha Toshiba Character recognition apparatus using edge images

Also Published As

Publication number Publication date
US4977603A (en) 1990-12-11

Similar Documents

Publication Publication Date Title
JPH01183793A (ja) 文字認識装置
US6178261B1 (en) Method and system for extracting features in a pattern recognition system
Berger et al. An algorithm for point clustering and grid generation
EP0085545B1 (en) Pattern recognition apparatus and method for making same
US7840037B2 (en) Adaptive scanning for performance enhancement in image detection systems
US7068843B2 (en) Method for extracting and matching gesture features of image
US9275305B2 (en) Learning device and method, recognition device and method, and program
Han et al. An efficient fully parallel thinning algorithm
EP0602311B1 (en) Character recognizing apparatus
Galvanin et al. The canny detector with edge region focusing using an anisotropic diffusion process
Arlandis et al. Handwritten character recognition using the continuous distance transformation
JP3113769B2 (ja) 文字認識装置
Nandy et al. Generalized feature extraction using expansion matching
JP4231375B2 (ja) パターン認識装置、パターン認識方法、パターン認識プログラムおよびパターン認識プログラムを記録した記録媒体。
Iwane et al. A functional classification approach to layout analysis of document images
EP0606519A2 (en) Apparatus for character segmentation and apparatus for character recognition using the same
JP3666909B2 (ja) 文字認識装置及び方法
Aksoy et al. Signature verification using rules 3-ext inductive learning system
JPS63282582A (ja) パタ−ン認識装置
JP2792063B2 (ja) 文字認識辞書作成方式
Lam et al. Automatic evaluation of skeleton shapes
Wahyu Offline Handwriting Recognition Using Feedforward Neural Network
JP3835937B2 (ja) 特徴抽出方法及び該方法を実施するための特徴抽出装置及び記録媒体
Williams et al. Word spotting in bitmapped documents
Sproull et al. A comparison of codebook generation techniques for vector quantization