JPH04259088A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH04259088A
JPH04259088A JP3021157A JP2115791A JPH04259088A JP H04259088 A JPH04259088 A JP H04259088A JP 3021157 A JP3021157 A JP 3021157A JP 2115791 A JP2115791 A JP 2115791A JP H04259088 A JPH04259088 A JP H04259088A
Authority
JP
Japan
Prior art keywords
character
feature quantity
character pattern
coordinate
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3021157A
Other languages
English (en)
Inventor
Koji Yura
浩司 由良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP3021157A priority Critical patent/JPH04259088A/ja
Publication of JPH04259088A publication Critical patent/JPH04259088A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は座標入力装置を介して筆
記された文字パターンを、筆順や筆記画数の変化に拘り
なく効率的に認識することのできる文字認識装置に関す
る。
【0002】
【従来の技術】近時、情報処理技術の発達に伴って各種
の文字認識装置が開発されている。タブレット等の座標
入力装置を介して筆記された文字パターンを認識して文
字情報入力を行う、所謂オンライン文字認識装置もその
1つであり、紙の上に鉛筆を用いて文字を筆記するのと
同様な感覚で、簡易に自然性良く情報処理装置に対する
文字情報の入力を行い得ると云う利点を持つ。
【0003】この種のオンライン文字認識装置は、基本
的には座標入力装置を介して筆記される文字パターンの
情報(筆跡)を座標値の系列として入力する。そしてこ
の座標値系列を解析することで筆記ストロークの特徴や
その位置関係,更には筆順等を文字パターンの特徴情報
として抽出し、認識辞書に予め登録されている認識対象
文字についての特徴情報と比較照合することによって前
記文字パターンを認識するものとなっている。
【0004】これ故、例えば文字パターンの筆記順次(
筆順)が異なっていると、その認識処理が徒に複雑化し
、誤認識の原因となると云う問題がある。またこのよう
な筆順の影響を回避するべく筆画の並べ替えを行うと、
その文字パターンの画数に大きな影響を与え、新たな誤
認識の原因となる。つまり画数の多い漢字の場合、その
書き方によって筆順や画数が変動し易く、誤認識や認識
リジェクトの大きな原因となっている。
【0005】そこで従来では、筆順や画数の変動を予め
辞書登録しておくことで上述した不具合に対処すること
が試みられている。しかし筆順や画数の変動についての
情報を辞書登録しておくにも限度があり、現実に筆記入
力される文字情報に十分対処することができないと云う
問題がある。しかもこのような対処を施すと、未自認式
処理に要する負担が急激に増え、その処理量の増大に伴
って認識処理効率が大幅に低下すると云う問題がある。
【0006】
【発明が解決しようとする課題】このような従来のオン
ライン型の文字認識装置にあっては、筆順や画数の変化
に対処することが非常に困難であり、認識性能の低下や
認識処理負担の増大等の種々の不具合があった。
【0007】本発明はこのような事情を考慮してなされ
たもので、その目的とするところは、筆順や画数の変化
に拘ることなしに座標入力装置を介して筆記される文字
パターンを効率的に、しかも性能良く認識することので
きる文字認識装置を提供することにある。
【0008】
【課題を解決するための手段】本発明は、座標入力装置
を介して筆記された文字パターンの情報を座標値の系列
として入力し、この座標値系列から前記文字パターンを
認識する文字認識装置において、文字パターンが筆記さ
れた座標面空間を複数の部分領域に分割し、各部分領域
毎にその領域内に含まれる座標値系列から、例えば先ず
各部分領域に含まれる座標値系列から2点間を繋ぐ線分
の集合を求め、この線分の集合における各線分の方向に
ついての分布を各部分領域の特徴量として求め、これら
の各部分領域においてそれぞれ求められる特徴量に基づ
いて前記文字パターンを認識処理するようにしたことを
特徴とするものである。
【0009】
【作用】本発明によれば、文字パターンが筆記された座
標面空間を複数の部分領域に分割し、これらの各部分領
域毎にその領域内の座標値系列で示される部分的な筆記
ストロークの特徴量が、例えば2点間を繋ぐ線分の集合
の方向分布として求められ、これらの各部分領域の特徴
量に基づいて前記文字パターンの認識処理が実行される
。この結果、筆順やその画数に関係なく文字パターンを
認識処理することが可能となり、筆順や画数の変化を考
慮した従来の認識処理に比較して、その認識処理を非常
に効率的に、且つ認識性能良く実行することが可能とな
る。
【0010】
【実施例】以下、図面を参照して本発明の一実施例に係
る文字認識装置について説明する。  図1は実施例装
置の概略的な機能構成を示すブロック図で、 1はタブ
レット等からなる座標入力装置である。この座標入力装
置1 は所定の入力座標面を備え、ペンを用いて指示さ
れた上記座標面上の位置をその座標値として順次入力す
るものである。この座標入力装置1 を介する文字情報
の入力は、ペンを用いて上記座標入力装置1 の座標面
上に入力すべき文字を筆記することにより点列の繋がり
として入力され、その筆記情報(文字パターンの軌跡)
は各点のxy座標値の系列として取込まれる。この座標
値の系列は、例えば図2に示すようにx座標値とy座標
値との対として順次読み込まれ、図示しない入力バッフ
ァに格納される。
【0011】しかしてストローク正規化部2 は、上述
した如く求められた座標値の系列を、例えば図3に示す
ように文字パターンの上下方向の下向きを正方向とした
Y座標、文字パターンの左右方向を右向きを正方向とし
たX座標とし、その外接枠の左上隅のxy座標を[ 0
, 0],右下隅のxy座標を[99,99]として、
その大きさを正規化する。このようにして正規化された
座標値系列に対してストローク領域分割部3 は、例え
ば図4に示すようにその文字領域を縦横にそれぞれ4分
割し、16個の部分領域R1,R2,〜R16を設定す
る。そしてストローク領域分割部3は前述した如く正規
化された座標値系列が上記各部分領域R1,R2,〜R
16の中のどの領域に含まれるかを調べ、例えば図5に
示すように正規化された座標値の系列に対し、各座標値
がどの部分領域Rn( 1≦n≦16) に含まれるか
の情報を付加する。
【0012】例えば図4に示す筆記文字パターン[べ]
の場合には、正規化された筆記ストロークの1番目の座
標値が[ 0,61]であり、その座標値は部分領域R
9 に含まれること、また2番目の座標値が[ 3,5
7]であり、その座標値は部分領域R9に含まれること
、……を順に求める。
【0013】このようにして求められる正規化された座
標値の系列は、例えばPi,j として表現する。但し
、iは文字パターンを現す何画目の筆記ストロークであ
るかを示すパラメータであり、総画数をmとした場合に
は(1≦i≦m)なる値を取る。またjは上記各筆記ス
トロークの何番目の座標(点)であるかを示すパラメー
タである。また上記各点Pi,j が前述したどの部分
領域Rn に含まれるかは、例えばri,j として表
現される。この情報ri,j は、前述した部分領域R
n (1≦n≦16) の値を取ることは云うまでもな
い。
【0014】しかして特徴抽出部4 は上述した如く求
められた点列の情報Pi,j ,ri,j に従い、隣
り合う2点間を結ぶ線分がどの向きを向いているかを求
め、上記線分の集合における方向の分布を前述した各部
分領域Rn 毎に求める。そしてその方向分布を各部分
領域Rn における筆記ストロークの特徴量として抽出
する。即ち、座標値の系列で示される筆記ストロークの
上述した隣り合う2点間を結ぶ線分の向きは、例えば図
6に示す如く8分割して量子化された方向D1,D2,
〜D8 のいずれであるかを判定することによって求め
られる。
【0015】具体的には点Pi,j から点Pi,j+
1 に至る線分の向きdi,j の値としてDk (1
≦n≦8)が順次求められる。そして前述した各部分領
域Rn 毎に、その領域に含まれる点列が形成する線分
の集合の向きについて、その分布Fn,k をFn,k
 =[(ri,j =Rn )and (di,j =
Dk )を満たすPi,j の数]として求め、これを
その部分領域Rn の特徴量とする。
【0016】辞書照合部5 はこのようにして求められ
た各部分領域Rnの特徴量Fn,k について、辞書記
憶部6 に予め登録設定されている認識対象文字につい
ての標準的な特徴量(認識辞書)とそれぞれ比較照合す
ることで、前述した文字パターンを認識処理する。この
認識処理は、例えば飯島泰蔵  著『パターン認識』 
 昭和48年11月  株式会社コロナ社発行に示され
るような複合類似度法を用いて実行される。
【0017】即、辞書記憶部6 に記憶される認識辞書
は、認識対象とする文字種毎に、多くのサンプル文字デ
ータについて上述した特徴量Fn,k をそれぞれ求め
、これらのサンプルデータからその主成分φa,n,k
 (1≦a≦A;Aは主成分の数)とその重みλa と
を求め、これを各文字についての準的な特徴量とするこ
とにより作成される。
【0018】複合類似度法による文字認識処理は、入力
された文字パターンについての特徴量Fn,k と、認
識辞書部6 に登録されている文字種毎の特徴量(主成
分φa,n,kと重みλa )とを用い、[Σλa (
φa ・F)]なる主成分毎の内積演算結果の重み付け
された総和値を複合類似度として計算する。そして、例
えば最大類似度値を得た文字種のカテゴリ名を、入力文
字パターンについての認識結果として求める。
【0019】このように本装置では、文字パターンが入
力された領域を複数の部分領域に分割し、各部分領域毎
に、その領域に含まれる点列がなす線分の集合における
各線分の向きの分布を特徴量として求め、この特徴量に
従って前記文字パターンを認識処理するものとなってい
る。従って手書き入力された文字パターンの筆順や画数
の変化に左右されることなく、その入力文字パターンを
高性能に認識することが可能となる。しかもその処理量
としても、従来の筆画の並べ替えを行うもののように膨
大化することがなく、短時間に効率良く文字の認識処理
を行うことが可能となる。特に文字パターンの大きさを
正規化した後、その文字領域を複数の部分領域に分割し
て、各部分領域毎に線分の方向分布を特徴量として求め
るので、効率的に、しかも高性能に認識処理を進めるこ
とができる等の実用上多大なる効果が奏せられる。
【0020】尚、本発明は上述した実施例に限定される
ものではない。例えば部分領域の分割数や、各部分領域
の特徴量の算出法については、装置に対する仕様に応じ
て定めれば良いものである。また特徴量に基づく文字認
識処理法についても従来より種々提唱されている手法を
適宜作用することができる。その他、本発明はその要旨
を逸脱しない範囲で種々変形して実施可能である。
【0021】
【発明の効果】以上説明したように本発明によれば、座
標入力装置を介して手書きされた文字パターンを、その
筆順や画数の変化の影響を受けることなく効率的に、し
かも高性能に認識処理することができ、その処理負担を
大幅に軽減することができる等の実用上多大なる効果が
奏せられる。
【図面の簡単な説明】
【図1】  本発明の一実施例に係る文字認識装置の基
本的な機能を示すブロック図。
【図2】  座標入力装置から入力される文字パターン
の座標値系列を示す図。
【図3】  文字パターンの大きさの正規化を示す図。
【図4】  文字パターン領域の分割例を示す図。
【図5】  正規化された座標値系列と部分領域との関
係を示す図。
【図6】  線分の向きの量子化の例を示す図。
【符号の説明】
1…座標入力装置、 2…ストローク正規化部、 3…
ストローク領域分割部、 4…特徴抽出部、 5…辞書
照合部、 6…辞書記憶部。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】  座標入力装置を介して筆記された文字
    パターンの情報を座標値の系列として入力し、この座標
    値系列から前記文字パターンを認識する文字認識装置に
    おいて、文字パターンが筆記された座標面空間を複数の
    部分領域に分割し、各部分領域毎にその領域内に含まれ
    る座標値系列から特徴量を求める手段と、上記各部分領
    域においてそれぞれ求められる特徴量に基づいて前記文
    字パターンを認識処理する手段とを具備したことを特徴
    とする文字認識装置。
  2. 【請求項2】  各部分領域毎に特徴量を求める手段は
    、各部分領域に含まれる座標値系列から2点間を繋ぐ線
    分の集合を求め、この線分の集合から各線分の方向につ
    いての分布として求め、この分布を特徴量とするもので
    ある請求項1に記載の文字認識装置。
JP3021157A 1991-02-14 1991-02-14 文字認識装置 Pending JPH04259088A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3021157A JPH04259088A (ja) 1991-02-14 1991-02-14 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3021157A JPH04259088A (ja) 1991-02-14 1991-02-14 文字認識装置

Publications (1)

Publication Number Publication Date
JPH04259088A true JPH04259088A (ja) 1992-09-14

Family

ID=12047081

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3021157A Pending JPH04259088A (ja) 1991-02-14 1991-02-14 文字認識装置

Country Status (1)

Country Link
JP (1) JPH04259088A (ja)

Similar Documents

Publication Publication Date Title
US6144764A (en) Method and apparatus for on-line handwritten input character recognition and recording medium for executing the method
US5515455A (en) System for recognizing handwritten words of cursive script
WO1995024016A1 (en) Vector quantization with low data dimensionality for handwriting recognizer
CN115461792A (zh) 手写文本识别方法、装置和系统,手写文本搜索方法和系统,以及计算机可读存储介质
CN111738167A (zh) 一种无约束手写文本图像的识别方法
US5659633A (en) Character recognition method utilizing compass directions and torsion points as features
Tang et al. Online chemical symbol recognition for handwritten chemical expression recognition
CN113468972B (zh) 用于复杂场景手写识别的手写轨迹切分方法及计算机产品
JPH04259088A (ja) 文字認識装置
CN111459395A (zh) 手势识别方法、系统、存储介质、人机交互设备
JP3817281B2 (ja) 情報処理装置及び方法
KR102007791B1 (ko) 단계별 윤곽선 특성 분석을 이용한 숫자 인식 방법 및 장치
KR200331200Y1 (ko) 프렉탈 차원을 이용한 문자인식장치
JPH09114926A (ja) オンライン文字認識における入力文字大分類方法および装置
JPH09231314A (ja) オンライン手書き文字認識装置
Patel et al. Comprehensive Study on Recognition of offline Handwritten Gujarati Numerals
Babczyński et al. Direct Tensor Voting in line segmentation of handwritten documents
JPH1021398A (ja) 方向特徴ベクトル抽出方法
Tang et al. Chemical symbol feature set for handwritten chemical symbol recognition
JPH01213772A (ja) オンライン文字認識方式
CN116958995A (zh) 一种基于字符在平面位置信息的分段方法
JP3139701B2 (ja) ファジィベクトルによるオンライン手書き入力文字認識方法及び装置並びにその方法を実行するための記録媒体
CN115240206A (zh) 手写字迹鉴别方法及系统
JPS62229383A (ja) オンライン文字認識装置
JPH09114927A (ja) オンライン文字認識における入力文字大分類方法および装置