JPH02235189A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH02235189A
JPH02235189A JP1055155A JP5515589A JPH02235189A JP H02235189 A JPH02235189 A JP H02235189A JP 1055155 A JP1055155 A JP 1055155A JP 5515589 A JP5515589 A JP 5515589A JP H02235189 A JPH02235189 A JP H02235189A
Authority
JP
Japan
Prior art keywords
character
template
additional
dictionary
distance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1055155A
Other languages
English (en)
Inventor
Seiichiro Yamaguchi
誠一郎 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP1055155A priority Critical patent/JPH02235189A/ja
Publication of JPH02235189A publication Critical patent/JPH02235189A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (概要) 光学的に文字を読み込み、そのビデオデータから特徴を
抽出し、予め辞書に登録されている特徴と比較して、特
徴となるデータの距離が近いものを認識結果とする文字
認識装置に関し、誤読した文字を辞書に追加登録を行ウ
た場合、高い認識率を得ることをその目的とし、誤読し
た文字の特徴を追加テンプレートとして登録する追加登
録部と、抽出した入力文字の特徴と辞書に登録されてい
るテンプレートとの距離を計算する計算方法を、元から
記憶されている基本テンプレートと前記追加テンプレー
トとで異なる方法とする距離計算手段とを有するように
構成する。
(産業上の利用分野) この発明は、光学的に文字を読み込み、そのビデオデー
タから特徴を抽出し、予め辞書に登録されている特徴と
比較して、特徴となるデータの距離が近いものを認識結
果とする文字認識装置に関する。
〔従来の技術〕
従来、ビデオデータから文字の特徴を抽出する文字認識
装置1としては、例えば第4図に示すように、ビデオデ
ータによる入力文字から、特徴抽出機2によって文字の
特徴を抽出するようにし、一方記憶装置としての辞書3
の中には、基本テンプレート4と追加テンプレート5が
あって、それぞれ多数の文字の特徴を記憶している。そ
して入力文字のパターンと、辞書3に記憶している文字
の特徴とを、距離計算部6によって比較し、それらのう
ち最も距離が近いものを、辞書3のテンプレートに相当
する文字として認識するものがある。しかして認識対象
文字についてそのあらゆる変形(文字フォントの違いや
手書きの場合の変形)に対応するため、誤読をした場合
にはこれを検出するようにし、誤読をした文字の特徴を
辞書に追加登録して、認識のテンプレートを複数化する
ことにより、文字の認識率を高める方法を取っている。
(発明が解決しようとする課題) ところでこのような従来の文字認識装置にあっては、誤
読した文字の特徴を追加テンプレートとして登録すると
、誤読した文字そのものは読取りができるようになるが
、ただ単に誤読文字の特徴を追加するだけでは、別の文
字のパターンに近いものになっていることもあるので、
別の文字を誤読するようになるため、誤読した文字を追
加していくだけでは、認識率を高めることができないと
いう問題があった。
この発明は、このような従来の課題に着目してなされた
もので、誤読した文字を辞書に追加登録を行った場合に
、高い認識率を得ることができる文字認識装置を得るこ
とをその目的とする。
〔課題を解決するための手段〕
本発明において上記の課題を解決するための手段は、第
1図に示すように、ビデオ入力部11で光学的に文字を
読み込み、そのビデオデータから特徴抽出部13で抽出
した特徴と、予め辞書15にテンプレート16として登
録されている文字の特徴とを、距離計算部20で比較し
て、特徴となるデータの距離が近いものを認識結果とす
る文字認識装置10において、誤読した文字の特徴を追
加テンプレート17として登録する追加登録部18と、
抽出した入力文字の特徴と辞書15に登録されているテ
ンプレート16との距離を計算する計算方法を、元から
記憶されている基本テンプレート16と前記追加テンプ
レート17とで異なる方法とする距離計算手段22とを
有するようにすることである。
〔作用〕
次に第1図に基づいて本発明の作用を説明すると、文字
認識装置10の操作中に誤読が発生したときには、誤読
した文字の特徴を、追加登録部18によって追加テンプ
レート17として登録する。そして次に入力し抽出され
た文字の特徴と、辞書15に予め登録されているテンプ
レート16との距離を、距離計算手段22によって計算
するが、そのときの計算方法を、元から記憶されている
基本テンプレート16と、追加テンプレート17とでは
異なる計算方法によって認識する。
〔実施例〕
以下、この発明の実施例を図面に基づいて説明する。
第2図は本発明の一実施例を示す構成図で、文字認識装
置10は、認識すべき文字が入力するビデオ入力部1l
、位置決め部12があり、特徴抽出部13を経て文字認
識部14に至っている。
文字認識部14には辞書15があり、辞書15には基本
テンプレート16と追加テンプレート17があり、それ
ぞれ多数の文字の特徴を記憶している。また文字認識部
1゛4には、特徴抽出部13からの値と辞書のテンプレ
ートの値とを比較するための距離計算部20があり、認
識結果を出力する表示部21が設けられている。表示部
21によって誤読がありだかどうかが分るが、辞書15
に誤読した文字の特徴を、追加テンプレートl7として
登録する追加登録部18があり、距離計算部20には、
追加登録部18で登録した追加テンプレート17との距
離を計算する距離計算手段22がある。
ビデオ入力部11では、八カする文字を光学的に読み込
み、スキャナからのイメージデータをメモリ上に格納し
、位置決め部l2で文字のあるメモリ上の位置を検出す
る。そしてビデオ入力部11のビデオデータから特徴抽
出部13によって入力文字の特徴が抽出され、抽出され
た文字情報は次の文字認識部14に入力する。文字認識
部14では辞書15に記憶されている、基本テンプレー
ト16と追加テンプレート17の内容と文字情報とが、
距離計算部20で計算されて比較され、入力文字情報と
最も近い基本テンプレート16または追加テンプレート
17のデータが、認識結果として表示部21に表示され
る。このと?誤読があれば追加登録部18に、誤読した
文字の特徴を追加テンプレート17として登録する。
そして次に文字情報が入力したときには、距離計算部2
0において、抽出した入力文字の特徴と、辞書15に登
録されているテンプレートとの距離が計算される。この
計算は距離計算手段22によって行われ、元から記憶さ
れている基本テンプレート16の内容と文字入力情報が
計算される場合と、追加登録部18によって記憶させた
追加テンプレート17の内容と文字情輻が計算される場
合とでは、異なる計算方法を用いる。
第3図は距離計算手段22の計算例におけるメモリを示
し、入力文字から特徴抽出部13によって得られた特徴
データなAとする。データAはA■,A2,・・・,A
nから構成され、データBは辞書15の中のあるテンプ
レートのデータでBt,B2,・・・.Bnから構成さ
れている。入力文字の特徴データAと、辞書データBと
の距離を求めるには、A I, A 2, ”・, A
 nおよびB 1+ B 2+ ”’ + B nの関
数として、 f( A 1, Bt)・・・・・−−−−f (An
, Bn)を出し、を計算すればよい。上記の関数とし
ては、基本テンプレートに対しては、 F (X,Y)=IX−Yl  を使財する。
追加テンプレートに対しては、 l X−Y l <D  のときは f (X,Y)= IX−Yl  を、I X−Y l
 >D  のときは f (X,Y)= (X−Y)”を使用する。
上記のDの値は経験的に求められる値であり、Dの値が
大きいときは追加した文字が読み易く、Dの値が小さい
ときは追加した文字による誤読率が小さくなる。
このように基本テンプレート16の内容と文字入力情報
とが計算される場合と、追加登録部18によって記憶さ
せた追加テンプレートl7の内容と文字情報とが計算さ
れる場合とでは、異なる関数を使用するのである。追加
したテンプレートでは文字の認識範囲を成るべく狭める
方向に計算方法を変えるのがよく、殆どそのものではな
いと認識しないようにすべきで、このようにして文字の
認識率を高めることができる。
(発明の効果) 以上説明したようにこの発明によれば、誤読した文字の
特徴を追加テンプレートとして登録したとき、元から記
憶されている基本テンプレートと追加テンプレートとで
、異なる計算方法によって入力文字のパターンを比較す
るので、学習によって追加された辞書のテンプレートが
、別の文字として誤読されることが少なく、高い認識率
の文字認識装置を得ることができる。
【図面の簡単な説明】
第1図は本発明の原理ブロック図,第2図は本発明の一
実施例を示すブロック図、第3図は入力文字と辞書の特
徴により、距離を計算する場合のメモリの内容を示す図
、第4図は従来の文字認識装置の構成を示すブロック図
である。 O・・・文字認識装置 1・・・ビデオ入力部 3・・・特徴抽出部 5・・・辞書 6・・・(基本)テンプレート 7・・・追加テンプレート 8・・・追加登録部 0・・・距離計算部 2・・・距離計算手段

Claims (1)

  1. 【特許請求の範囲】 光学的に文字を読み込み、そのビデオデータから抽出し
    た特徴と、予め辞書(15)にテンプレート(16)と
    して登録されている文字の特徴とを比較して、特徴とな
    るデータの距離が近いものを認識結果とする文字認識装
    置(10)において、 誤読した文字の特徴を追加テンプレート(17)として
    登録する追加登録部(18)と、 抽出した入力文字の特徴と辞書(15)に登録されてい
    るテンプレート(16)との距離を計算する計算方法を
    、元から記憶されている基本テンプレート(16)と前
    記追加テンプレート(17)とで異なる方法とする距離
    計算手段(22)と を有することを特徴とする文字認識装置。
JP1055155A 1989-03-09 1989-03-09 文字認識装置 Pending JPH02235189A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1055155A JPH02235189A (ja) 1989-03-09 1989-03-09 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1055155A JPH02235189A (ja) 1989-03-09 1989-03-09 文字認識装置

Publications (1)

Publication Number Publication Date
JPH02235189A true JPH02235189A (ja) 1990-09-18

Family

ID=12990859

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1055155A Pending JPH02235189A (ja) 1989-03-09 1989-03-09 文字認識装置

Country Status (1)

Country Link
JP (1) JPH02235189A (ja)

Similar Documents

Publication Publication Date Title
TWI726422B (zh) 二維碼識別方法、裝置及設備
KR970049402A (ko) 화상 처리 방법과 장치, 및 기억 매체
JPH02235189A (ja) 文字認識装置
US6208756B1 (en) Hand-written character recognition device with noise removal
JPH07168910A (ja) 文書レイアウト解析装置及び文書フォ−マット識別装置
JPS62159291A (ja) 文章入力装置
EP0377129A2 (en) Fast spatial segmenter for handwritten characters
JP4092847B2 (ja) 文字認識装置および文字認識方法
JP2977244B2 (ja) 文字認識方法及び文字認識装置
JP2851865B2 (ja) 文字認識装置
JP3069771B2 (ja) パターン認識方法及び装置
JPS62281082A (ja) 文字認識装置
KR20220168787A (ko) 만주어의 글자 추출 방법 및 이를 수행하는 시스템
JP2785438B2 (ja) 文字認識方式
JPS622382A (ja) 画像処理方法
JPH0656625B2 (ja) 特徴抽出方式
JP2665488B2 (ja) 個人辞書登録方式
JP2972443B2 (ja) 文字認識装置
JPH04216171A (ja) 輪郭ベクトルの抽出方法
JPH01201789A (ja) 文字読取装置
JPH0475554B2 (ja)
JPH04156694A (ja) 文字認識方式
JPH05225397A (ja) 文字形状整形装置
JPS62286190A (ja) オンライン濁音半濁音識別方式
JPH08161431A (ja) 文字認識装置