JPH0520503A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH0520503A
JPH0520503A JP3169651A JP16965191A JPH0520503A JP H0520503 A JPH0520503 A JP H0520503A JP 3169651 A JP3169651 A JP 3169651A JP 16965191 A JP16965191 A JP 16965191A JP H0520503 A JPH0520503 A JP H0520503A
Authority
JP
Japan
Prior art keywords
character
candidate
characters
recognition
recognized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3169651A
Other languages
English (en)
Inventor
Yoshiyuki Kodama
良幸 児玉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP3169651A priority Critical patent/JPH0520503A/ja
Publication of JPH0520503A publication Critical patent/JPH0520503A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 OCR装置やオンライン文字認識装置の文字
認識において再入力が少なく修正が容易でかつ高速認識
を可能とする。 【構成】 文字認識装置に入力された文字データを、文
字認識部4で文字認識を行ない、文字候補出力部6で認
識文字を参照データとする文字候補を形状が類似する文
字をまとめた候補文字辞書部から選択し、文字認識部4
で認識された文字と文字候補出力部で加えられた文字を
候補文字として出力する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字を形状から認識す
る文字認識装置に関する。
【0002】
【従来の技術】従来の文字認識装置では、文字データを
図形データとして入力しその形状から文字を認識し複数
の文字を候補文字として出力する場合、はじめに文字デ
ータをタブレット上にペンで図形データとして入力する
かまたは紙に書いた文字を光学式スキャナで図形データ
として入力し、次にその文字データの形状の特徴抽出を
行ない、続いて文字認識装置中に登録されている認識可
能な文字全てまたは文字データの大まかな特徴から大分
類を行なった後の複数の文字について、文字認識装置中
の文字形状特徴と入力された文字データの特徴との比較
を行い、それぞれの文字に対する類似度を計算し、類似
度の高い文字から候補文字の選定を行なっていた。
【0003】
【発明が解決しようとする課題】しかし、従来の方法で
は入力した文字の形状が、例えば手書き文字の時に癖や
速く書いたためある程度崩れ、文字認識装置に登録され
ている文字形状の特徴から離れてしまった場合、目的の
文字が候補に上がらないということが発生した。例を図
2の従来の文字認識装置における認識結果を示す図に示
す。この例では、文字認識装置に記号のセミコロ
ン「;」を入力したつもりであるが、文字の形状が崩れ
第2ストローク22の形状が縦方向に長く延びた為、セ
ミコロンの第2ストロークとしては形状がかなり違うた
め認識結果として第1候補にアルファベットの小文字の
「i」と第2候補に「j」が候補文字として出力されセ
ミコロン「;」は候補として出力されない場合があっ
た。
【0004】一方、多数の候補文字を出力するために
は、数多くの文字について特徴比較をを行ない、類似度
の計算結果をそれぞれの文字で最後まで正確に求めなけ
ればならず、認識時間が長くなってしまうといった問題
があった。また、少々の文字の変形に対応するため(多
くの形状を許容するため)に認識対象文字それぞれの文
字に対して複数の形状特徴を記録しておかねばならず、
文字認識装置内の文字の特徴辞書が大きくなってしまう
といった問題もあった。一般的に特徴辞書が大きくなる
と必要メモリの容量の増大および検索時間が長くなると
いった問題が発生する。
【0005】
【課題を解決するための手段】本発明の文字認識装置
は、入力された文字を形状から認識する文字認識手段と
形状の類似する文字を含む候補文字辞書とを有し 前記文字認識手段によって認識された認識文字と、前記
認識文字から参照される前記候補文字辞書中の文字の集
合を候補文字とする手段を有することを特徴とする。
【0006】
【実施例】
(実施例1)本発明の実施例1を図1に示す。図1の実
施例は、いわゆるオンライン文字認識を用いた装置で、
ペン入力された文字データを認識し認識結果の文字を表
示装置上に表示すると共にメモリに記憶する文字認識装
置のブロック図である。ペン入力によりタブレット部1
から図形データとして入力された文字データを、前処理
部2によりノイズの除去及びストロークのスムージング
を行なう。次に前処理を行なった文字データを特徴抽出
部3により形状の特徴を抽出する。抽出された特徴を、
文字認識装置に予め登録されている認識対象文字の特徴
を現わす文字特徴辞書部5の文字と、文字認識部4で比
較し文字特徴辞書部5に登録されている文字との類似度
を評価し、特徴辞書部5のなかの最も類似度の高い1文
字を認識結果の文字として出力する。
【0007】文字認識部4より出力された認識文字1文
字は候補文字出力部6に送られる。候補文字出力部6で
は、候補文字辞書部7に登録されている候補文字から入
力された認識文字が示す候補文字が登録されていれば、
その1つまたは複数の候補文字を認識文字1文字に加え
て出力を行なう。候補文字辞書部7の辞書構造を図3の
候補文字辞書A構造図に示す。候補文字辞書は、認識文
字1文字をインデックスとする類似形状文字の集合で作
られる表形式となっている。例えば、アルファベット小
文字の「i」に形状が類似している文字としてセミコロ
ン「;」アルファベットの小文字の「j」コロン「:」
繰り返し文字を表わす記号の「〃」の4文字が登録され
ている。またアルファベットの小文字「t」は類似文字
として漢字の「七」カタカナの「ヒ」数学記号のプラス
「+」カタカナの「ト」漢字の「十」が登録されてい
る。候補文字辞書を使用して候補文字を出力する方法
は、図4の候補文字出力処理の流れ図に示す。図4の4
1で入力された認識文字1文字から認識文字が示す候補
文字表を参照する。候補文字が登録されていないときは
42で分岐し認識文字1文字を認識結果として出力す
る。一方、候補文字が登録されていた場合は42から4
3へ移り候補文字辞書の認識文字が示す1文字または複
数文字の候補文字を認識文字に加えて候補文字を含んだ
認識結果として出力する。つまり、文字認識部4の認識
文字「i」に対しては、候補文字出力部6から、認識文
字「i」を含む候補文字の集合である「i」「;」
「j」「:」「〃」が出力される。
【0008】図2の候補文字出力部7から出力された候
補文字は、図2の候補文字表示部8で表示装置上に表示
される。表示装置への表示は候補文字が1文字の場合つ
まり文字認識部4で認識された文字1字の場合はその文
字1字のみを表示装置上のカーソル位置に表示する。ま
た、複数の候補文字がある場合には、図5の候補文字の
表示装置出力図に示すように文字認識部4で認識された
文字をカーソル位置に表示し、候補文字出力部6で加え
られた候補文字をその近傍に表示する。図5の候補文字
51は、セミコロン「;」を入力したつもりがアルファ
ベットの小文字「i」と認識されてしまった場合で、
「i」を表示装置上のカーソル位置に表示し、候補文字
出力部6で加えられたその他の候補文字「;」
「j」「:」「〃」が枠内に選択可能な候補文字として
表示されたところである。
【0009】候補文字が複数ある場合は文字選択部9に
よって1文字を選択する。選択方法は図5の候補文字5
1内の正しい文字をデータ入力ペンによりポインティン
グする事で選択され確定される。確定された文字は、選
択文字表示部11で表示装置上のカーソル位置に表示さ
れる。一方その文字コードは文字記憶部10によりテキ
ストとしてメモリに記憶される。図5の候補文字51で
は、入力者はセミコロン「;」を入力したつもりである
から、データ入力ペンにより候補文字51中の「;」を
タッチすることにより「;」が選択され、表示装置上の
カーソル位置に「;」が表示される。また、セミコロン
の文字コードはメモリにテキストとの1部として記憶さ
れる。
【0010】実施例1では、タブレット上にペンで入力
する文字認識装置について説明してきたが、入力部分に
光学式のスキャナを用いて紙に印刷または手書きされた
文字を入力し、認識する文字認識装置でも同様に本発明
は有効である。
【0011】また、実施例1では文字認識部4より出力
される認識文字は1文字としたが複数の文字が認識結果
として出力されても本発明は有効である。この場合、認
識部4より出力された複数の認識結果の文字と、それぞ
れに対応する候補文字辞書部7で参照される候補文字を
候補文字の集合とし、重複する文字を削除し候補文字と
する。例えば、文字認識部4の認識結果が「iとj」で
それぞれの類似候補文字が「i」は「;」「j」「:」
「〃」で「j」は「;」「よ」だとした場合、両方の候
補文字を合わせた文字の集合は「i」「j」「;」
「j」「:」「〃」「;」「よ」となり、重複部分を省
いて「i」「j」「;」「:」「〃」「よ」が候補文字
として出力される。
【0012】また、実施例1では候補文字辞書の構造は
図3の様に1文字をインデックスとする構造としたが、
図6の候補文字辞書B構造図に示すように、類似文字を
1つの集合とする辞書構造として、参照される文字を含
む集合の文字全てを候補文字とすることもできる。図6
で認識文字が「i」とした場合、候補文字は「;」
「j」「:」「〃」となり、認識文字を「:」とした時
も同様の候補文字となる。候補文字辞書の中には形状の
近い類似文字の他に、人間が誤りやすい文字や同じ意味
を持つ文字等を含めてもかまわない。
【0013】
【発明の効果】本発明によれば、入力された文字データ
の特徴比較により認識された文字に加え辞書に登録して
ある形状の類似した文字が候補文字として出力されるた
め、入力された文字がかなり変形していて誤認識された
場合でも文字の候補中に目的の文字が含まれる可能性が
高く、再入力の機会が少なくなり高速に文字を入力する
ことが可能である。また、候補文字を全てまたは大分類
後の複数文字について文字の類似度を正確に計算して類
似度の高いものから候補文字とする従来の装置と比較し
て認識過程ではより少ない文字(1文字でもよい)でか
つラフな文字認識でも候補文字中に目的文字を含むこと
ができる。このため、文字の形状を表現する特徴辞書が
単純化でき、高速認識および文字の特徴辞書の小型化が
可能である。
【0014】つまり、以上の効果により小型で低価格の
文字認識を含む装置を実現できるということである。ま
た、高級な文字認識装置においてもより多くの候補文字
を得ることができるという効果がある。
【図面の簡単な説明】
【図1】本発明の文字認識装置の一実施例を示すブロッ
ク図。
【図2】従来の文字認識装置における認識結果を示す
図。
【図3】本発明の一実施例の候補文字辞書Aの構造図。
【図4】本発明の一実施例の候補文字出力処理の流れ
図。
【図5】本発明の一実施例の候補文字の表示装置出力
図。
【図6】本発明の一実施例の候補文字辞書Bの構造図。
【符号の説明】
1 タブレット部 2 前処理部 3 特徴抽出部 4 文字認識部 5 文字特徴辞書部 6 候補文字出力部 7 候補文字辞書部 8 候補文字表示部 9 文字選択部 10 選択文字記憶部 11 選択文字表示部 21 入力文字の第1ストローク 22 入力文字の第2ストローク 51 候補文字

Claims (1)

  1. 【特許請求の範囲】 【請求項1】 入力された文字を形状から認識する文字
    認識手段と形状の類似する文字を含む候補文字辞書とを
    有し前記文字認識手段によって認識された認識文字と、
    前記認識文字から参照される前記候補文字辞書中の文字
    の集合を候補文字とする手段を有することを特徴とする
    文字認識装置。
JP3169651A 1991-07-10 1991-07-10 文字認識装置 Pending JPH0520503A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3169651A JPH0520503A (ja) 1991-07-10 1991-07-10 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3169651A JPH0520503A (ja) 1991-07-10 1991-07-10 文字認識装置

Publications (1)

Publication Number Publication Date
JPH0520503A true JPH0520503A (ja) 1993-01-29

Family

ID=15890424

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3169651A Pending JPH0520503A (ja) 1991-07-10 1991-07-10 文字認識装置

Country Status (1)

Country Link
JP (1) JPH0520503A (ja)

Similar Documents

Publication Publication Date Title
JP2726568B2 (ja) 文字認識方法及び装置
EP1564675B1 (en) Apparatus and method for searching for digital ink query
JP3452774B2 (ja) 文字認識方法
Karayil et al. A segmentation-free approach for printed Devanagari script recognition
US7133556B1 (en) Character recognition device and method for detecting erroneously read characters, and computer readable medium to implement character recognition
JPH0520503A (ja) 文字認識装置
JPH0247788B2 (ja)
JPH1055409A (ja) 手書き入力情報処理装置
JPS5842904B2 (ja) 手書きカナ・漢字の文字認識装置
JPS60217483A (ja) 文字認識装置
JPH09114926A (ja) オンライン文字認識における入力文字大分類方法および装置
JP3015137B2 (ja) 手書文字認識装置
JP3128357B2 (ja) 文字認識処理装置
JPS61150081A (ja) 文字認識装置
JPH053631B2 (ja)
JPS58125183A (ja) 光学文字読取装置における認識不能文字表示方法
JPH11120294A (ja) 文字認識装置および媒体
JPH0830717A (ja) 文字認識方法とその装置
JP3365538B2 (ja) オンライン文字認識方法および装置
JPS608991A (ja) オンライン手書文字認識辞書登録方式
JP2931485B2 (ja) 文字切出し装置及び方法
JPH0527914B2 (ja)
JPH117492A (ja) キー入力編集方法及び編集装置
JP2549831B2 (ja) 文字認識装置の入力パターン・文字列登録方法
JPS6059487A (ja) 手書文字認識装置