JPH05258117A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH05258117A
JPH05258117A JP4052762A JP5276292A JPH05258117A JP H05258117 A JPH05258117 A JP H05258117A JP 4052762 A JP4052762 A JP 4052762A JP 5276292 A JP5276292 A JP 5276292A JP H05258117 A JPH05258117 A JP H05258117A
Authority
JP
Japan
Prior art keywords
character
character type
sample
pattern
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4052762A
Other languages
English (en)
Inventor
Takeshi Shimada
毅 島田
Mutsuo Ijuin
睦雄 伊集院
Kazuhito Haruki
和仁 春木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP4052762A priority Critical patent/JPH05258117A/ja
Publication of JPH05258117A publication Critical patent/JPH05258117A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】本発明は、手書き文字の認識率を向上させる文
字認識装置を提供する。 【構成】本発明は、予め、多数の人が記述した一連の文
字データセット群17をもとに文字種ごとに学習して代
表的な文字パターンを文字種見本として記憶する文字種
見本記憶部11と、前記文字データセット群を各人ごと
に前記文字種見本を当てはめて一連の文字種見本データ
セットを作成し書き癖の相関を学習し記憶する見本間相
関記憶部13とを有し、主文字認識部16により文字種
が確定された文字パターンの全てに対して、癖推定部1
4が前記文字種見本記憶部の文字種見本を検索して該当
する文字種見本を当てはめて文字種見本データセットを
作成し、前記見本間相関記憶部に記憶されている書き癖
と相関をとり、筆者の書き癖を推定した後、文字種判定
部15が、主文字認識部16により出力された文字種が
確定できない文字パターンと、前記推定された書き癖デ
ータを比較して不確定な文字パターンの文字種を判定す
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、手書き文字の文字認識
装置に関する。
【0002】
【従来の技術】従来の文字認識装置は、各文字種ごとに
サンプルパターンを集め、それらを統計的に処理して、
文字種のパターンが共通にもつ特徴を集めて辞書をつく
り、判定すべき文字パターンを各文字種の辞書と照らし
合わせて、文字種の特徴をどれだけ持っているかによっ
て、入力文字パターンに該当する文字種の確からしさを
判定していた。
【0003】図5は、従来の文字認識装置の概要構成ブ
ロック図である。図5において、従来の文字認識装置
は、認識すべき文字を入力する文字入力部51、入力さ
れた文字を文字パターンデータに変換する文字パターン
データ変換部52、文字パターンデータから辞書を参照
してパターンマッチングにより該当する文字種とされる
候補文字種を複合類似度法により算出する複合類似度計
算部53、前記複合類似度計算部53から算出された確
からしさにより確定する文字と確定されていない文字に
わける判定部54、文字列単位の知識処理により前記確
定した文字を修正し、前記確定されていない文字を可能
な限り確定する知識処理部55、知識処理部で最終的に
確定された文字種を出力する認識文字出力部56により
構成される。
【0004】すなわち、図5の従来の文字認識装置にお
いては、後処理手段である知識処理部において、確定さ
れていない文字を前後の文字配列から推定し、確定する
ことにより、本来の文字認識手段である複合類似度計算
部の文字種照合の確からしさの限界を補っていた。
【0005】この知識処理を行うために必要な辞書の作
成は、人名、住所等のカテゴリーごと特別に作成しなけ
ればならず、認識範囲も限定的であるという問題点があ
る。さらに、従来の文字認識装置において最も大きな問
題は、手書き文字を認識する場合である。異なる複数の
文字種の手書き文字パターンには、非常に類似した文字
パターンが含まれているため、従来の文字認識手法で手
書き文字パターンの文字種を判定するのは容易ではな
く、活字に比べて認識率が低くなることである。従っ
て、機械的知識処理ではカバ−できず、最終的に人的労
力がかかることにもなる。
【0006】図6は、手書き文字パターンの一例を示す
図である。図6の文字パターンは、数字”2”を意図し
てかかれる場合があり、また、英字”Z”を意図して書
かれる場合もある。
【0007】すなわち、図6の手書き文字パターンの文
字種を判定するには、図6の文字を書いた特定人の書き
癖という判断要素が必要であり、従来の文字認識手段に
よる、文字パターンが文字種パターンにいかに近いかと
いう、文字種に対する確からしさだけでは、前記特定人
の書いた文字種を正確に判定することはできないという
問題点があった。
【0008】
【発明が解決しようとする課題】前述したように、従来
の文字認識装置において、手書き文字の場合、書き癖と
いう判断要素が加わって複雑となり、文字種を正確に判
定することは容易でないという問題点があった。
【0009】そこで、本発明は、かかる問題点を除去
し、手書き文字の認識率を向上させる文字認識装置を提
供することを目的とする。
【0010】
【課題を解決するための手段】本発明は、特定の人が記
述した文書中の文字に対して文字種が確定している文字
パターンと文字種が不確定な文字パターンに分類するこ
とができる文字認識手段を具備した文字認識装置におい
て、多数の人が記述した一連の文字データセット群を文
字種ごとにパターン分類し、代表的な文字パターンを文
字種見本として文字種ごとに記憶する文字種見本記憶手
段と、前記一連の文字データセット群に対し、各人の文
字データセットごとに前記文字種見本を当てはめて一連
の文字種見本データセットを作成し、該文字種見本デー
タセット単位の相関をとって記憶する書き癖相関記憶手
段と、前記文字種が確定している一連の文字パターンの
全てに対して、前記文字種見本記憶手段に記憶されてい
る文字種見本を検索して該当する文字種見本を当ては
め、前記特定の人の文字種見本データセットを作成した
後、前記書き癖相関記憶手段に記憶されている書き癖と
相関をとり、前記特定の人の書き癖を推定する書き癖推
定手段と、前記文字種が不確定な文字パターンと前記書
き癖推定手段により推定された特定の人の書き癖データ
を比較して該不確定な文字パターンの文字種を判定する
文字種判定手段とを具備することを特徴とし、また、前
記文字種見本記憶手段及び前記書き癖相関記憶手段をニ
ューラルネットワークにより構成することを特徴とす
る。
【0011】
【作用】本発明は、特定の人が記述した文書中の文字に
対して文字種が確定している文字パターンと文字種が不
確定な文字パターンに分類することができる文字認識手
段を具備した文字認識装置において、多数の人が記述し
た一連の文字データセット群を文字種ごとに学習してパ
ターン分類し、代表的な文字パターンを文字種見本とし
て文字種ごとに記憶する文字種見本記憶手段と、前記一
連の文字データセット群に対し、各人の文字データセッ
トごとに前記文字種見本を当てはめて一連の文字種見本
データセットを作成し、該文字種見本データセット単位
の相関を学習して記憶する書き癖相関記憶手段とを有
し、前記文字種が確定している一連の文字パターンの全
てに対して、前記文字種見本記憶手段に記憶されている
文字種見本を検索して該当する文字種見本を当てはめ、
前記特定の人の文字種見本データセットを作成した後、
前記書き癖相関記憶手段に記憶されている書き癖と相関
をとり、前記特定の人の書き癖を推定し、前記文字種が
不確定な文字パターンと推定された特定の人の書き癖デ
ータを比較して該不確定な文字パターンの文字種を判定
するようにしているので、手書き文字認識率が向上す
る。
【0012】
【実施例】以下、図面を参照して本発明の一実施例につ
いて説明する。
【0013】図1は、本発明による一実施例である文字
認識装置の構成ブロック図である。図1の文字認識装置
は、ニューラルネットワークで構成された文字パターン
分類を文字種ごと行う文字種見本記憶部11、同じくニ
ューラルネットワークで構成された書き癖の相関をとっ
て記憶する見本間相関記憶部13、文字種見本記憶部1
1に学習用文字パターンデータを入力する見本学習入力
部10、見本間相関記憶部13に学習用文字パターンデ
ータを入力する見本間相関学習入力部12、特定の人の
文字パターン列の入力に対し、通常の文字認識手法によ
り文字種が確定された文字パターンと文字種が確定され
ない文字パターンに分類して出力する主文字認識部1
6、前記文字種が確定された文字パターンから書き癖を
推定する癖推定部14、前記癖推定部14の推定された
書き癖から文字種が確定されていない文字の文字種を判
定する文字種判定部15により構成される。
【0014】また、図1の文字認識装置は、機能上、大
きく、事前の書き癖の相関を学習する学習プロセス部1
と書き癖を推定し、判定しにくい文字パターンの文字種
を判定する判定プロセス部2に分けることができる。
【0015】まず、事前の書き癖を学習する学習プロセ
スについて説明する。学習プロセスは、さらに、文字種
見本の学習と見本間相関の学習に分けることができる。
【0016】最初に、文字種見本の学習について説明す
る。文字種見本の学習は、まず見本学習入力部10にお
いて、同一の人が、本文字認識装置の処理対象の全てで
あるn個の文字種を書いた文字パターンの組を、m人で
ある多くの人について集めた事例データセット17を、
図示していないデータファイルから読み込み、文字種ご
と、例えば文字種αについての文字パタ−ン(α11〜
αm1)を文字種見本記憶部11に送る。事例データセ
ット17を受け取った文字種見本記憶部11は、文字種
ごとに類似する文字パターンをひとまとめにし、1つの
まとまりに含まれる文字パターンのうち、典型的な文字
パターンを、該1つのまとまりを代表する文字種見本と
し、文字パターンの1つのまとまりと該まとまりを代表
する文字種見本を対にして記憶する。1つの文字種に対
して複数のまとまりができるので、文字種見本は複数と
なり、n種類の文字種全体では、n個の文字種見本群S
S1〜SSnを構成し、これが文字種見本群11に記憶
される。このようにして、文字種見本の学習は終了す
る。
【0017】次に、見本間相関の学習について説明す
る。まず、見本間相関学習入力部12は、見本学習入力
部10と同様に、事例データセット17を読み込む。見
本間相関学習入力部12は、事例データセット17の中
から、人単位の文字パターンの組を選び、文字種ごと、
文字種見本記憶部11内の該文字種の文字種見本群に記
憶されている文字パターンのまとまりを検索し、検索文
字パターンが含まれている文字パターンの文字種見本を
事例データセットの文字パターンに置き換える。同様に
して、他の文字パターンの全てについても、文字種見本
群を検索し該当する文字種見本に置き換える。さらに、
他の人の文字パターンの組についても、同様に全ての文
字パターンを文字種見本に置き換える。このようにし
て、m人の文字パターンの組の全てが代表される文字種
見本に置き換える。この後、見本間相関記憶部13は、
前記文字種見本に置換された文字パターンの組を、該文
字パターンに置換される前の文字パターンを書いた人の
書き癖とし、該書き癖のうち、多くの人が共通にもつ癖
だけを選び、記憶する。このようにして、見本間相関の
学習は終了する。
【0018】次に、書き癖を推定し、判定しにくい文字
パターンの文字種を判定する判定プロセスについて説明
する。なお、判定プロセスは、書き癖の推定と文字種の
判定に分けることができる。
【0019】最初に、書き癖の推定について説明する。
なお、判定プロセスの実施には、通常の文字認識手段、
例えば複合類似度法による文字認識手段を有する主文字
認識部16により、文字種が確定された文字パターンと
文字種が確定されない文字パターンに分離され、かつ文
字種が確定された文字パターンは、文字パターンと確定
された文字種の対となって出力されることが前提とな
る。さて、同一筆者が書いた、認識対象である文字パタ
ーン列18は、主文字認識部16に入力され、前記した
ように文字種が確定された文字パターンと文字種が確定
されていない文字パターンに分類され、文字種が確定さ
れた文字パターンは、該確定された文字種と対となって
出力される。例えば、確定された文字パタ−ンα´は文
字種αの対となる。前記文字種が確定された文字パター
ンと該文字種の対は、癖推定部14に入力される。癖推
定部14は、文字種見本記憶部11の文字種見本群SS
1〜SSnの中から、該文字種が記憶されている文字種
見本群を検索して、該文字種の対となっている文字パタ
ーンが属する文字パターンのまとまりの代表的な文字パ
ターンである、文字種見本を決定する。決定された文字
種見本は、該文字種の文字パターンとして置換される。
同様にして、全ての文字種が確定されている文字パター
ンと該文字種の対に対して検索し、該当する文字種見本
に置換する。なお、同じ文字種に対して文字パターンと
該確定された文字種がの対が複数ある時は、その中から
ひとつを選択する。このようにして、一連の文字種に対
して文字種見本が決定すると、該決定された文字種見本
列を、文字パターン列18を書いた筆者の書き癖として
見本間相関記憶部13に入力する。一般には、一部の文
字種については、文字種見本が判っておらず、見本間相
関記憶部13に入力される前記決定された文字種見本列
は、一部分が欠けたものとなっている。さて、見本間相
関記憶部13は、入力された前記文字種見本列に、最も
よく合致する書き癖を検索し、癖推定部14に送る。癖
推定部14は、入力された書き癖を、文字パターン列1
8を書いた筆者の書き癖として推定し記憶する。このよ
うにして、書き癖の推定は終了する。
【0020】次に、文字種の判定について説明する。ま
ず、文字種判定部15は、文字種の確定されていない文
字パターンを読み込む。文字種判定部15は、文字種が
確定されていない文字パターンを、癖推定部14に記憶
されている文字パターン列18の筆者の書き癖として推
定された各文字種見本と比較して、類似量を計算し、最
も大きな類似量を示す文字種見本を筆者の書いた文字種
と判定する。例えば、文字パタ−ンZ´に対し、最も大
きな類似量を持つ文字種見本Zが該文字パタ−ンの文字
種と判定する。このようにして、文字種の判定は終了す
る。
【0021】さて、次に、ニューラルネットワークで構
成されている文字種見本記憶部11及び見本間相関記憶
部13について詳細に説明する。
【0022】まず、文字種見本記憶部11について説明
する。文字種見本記憶部11は、LVQ(Learning Vec
tor Quantization:ベクトル量子化学習)法によるニュ
ーラルネットワークで構成される。図2は、文字種見本
記憶部11の構成を示す図である。図2において、ニュ
ーラルネットワークは文字種単位の文字種見本群S1〜
Snで構成されている。また、各文字種のニューラルネ
ットワークは入力層G1〜Gnと出力層P1〜Pnの2
層で構成され、入力層と出力層の構成素子すなわちニュ
ーロン間はすべて接続されている。なお、図2において
は、図面の表現の便宜上、ニューロン間の接続状態は一
部のみを表している。
【0023】見本学習入力部10によって分けられた文
字種ごとの入力文字パターン(G1〜Gn)は、該文字
パターンを構成するm画素の画像強度を成分とするベク
トルDとして扱われ、ベクトルDは(1)式のようにな
る。
【0024】 D=(d1,d2,…,dm) (1) また、ニューラルネットワークの入力層の入力素子l
(l=1〜m)から出力層の出力素子kへの重みwklも
ベクトルWkで表され、(2)のようになる。
【0025】 Wk=(wk1,wk2,…,wkm) (2) 学習は、次のような入力素子と出力素子間の結合の重み
荷重の修正により行われる。
【0026】まず、入力文字パターンのベクトルDに最
も近い荷重ベクトルWcを求める。すなわち、次の
(3)式を満たすWkをWcとして求める。
【0027】 ‖Wc−D‖= min‖Wk−D‖ (3) なお、ここで、‖・‖はベクトルの距離を表す。
【0028】次に、Wkを入力結合上の荷重ベクトルと
する出力素子Ucを中心として、半径rの領域を(4)
式で表される近傍Ncとする。
【0029】 Nc←{Uk|d(Uk,Uc)≦r} (4) なお、ここで、d(・,・)は出力素子同士の物理的な
距離を表す。
【0030】次に、Ncに属する出力素子Ukにつなが
る入力結合上のベクトルWkを修正する。すなわち、
(5)及び(6)式によってWkを修正する。
【0031】 △Wk←η(D−Wk) (5) Wk←Wk+△Wk (6) ここで、ηは学習係数を意味する定数である。
【0032】このようにして、事例データセット17に
含まれる全ての文字パターンについて適当な回数の修正
を行うと、各文字種用のニューラルネットワークである
文字種見本群記憶部S1〜Snに事例データセット中の
文字種の文字パターンを代表する見本群が記憶される。
すなわち、個々の文字種見本は、出力素子の入力結合上
の荷重ベクトルとして記憶される。
【0033】図3は、出力素子の反応特性の概形を示す
図である。図3の概形は、出力素子への入力結合上の荷
重ベクトルWkと入力文字パターンベクトルDとの近さ
を反映する特性であり、入力文字パターンベクトルDと
出力素子が記憶している見本が近ければ、出力素子は強
く反応する。
【0034】次に、見本間相関記憶部13のニューラル
ネットワークの学習について説明する。図4は見本間相
関記憶部13の構成を示す図である。見本間相関記憶部
13のニューラルネットワークは入力層PP1〜PP
n、中間層、出力層GG1〜GGnの3層からなり、パ
ックプロパゲーション法によるニューラルネットワーク
によって構成される。
【0035】まず、見本間相関記憶部13の学習は、文
字種見本記憶部11の文字種見本群の学習により記憶さ
れた出力素子の反応(PP1〜PPn)が入力される。
入力された文字種見本群の出力素子の反応は、中間層を
介して出力層GG1〜GGnの出力素子に出力される。
この際、教師信号T1〜Tnとして入力された事例デー
タセットの文字パターンそのものが与えられ、学習を行
う。この学習によって、各文字種の見本間の相関が、中
間層と出力層を結ぶニューラルネットワーク内の結合で
ある荷重ベクトルとして記憶される。
【0036】次に、本実施例について、帳票の住所認識
を例にとって説明する。
【0037】まず、多くの人が、カナ文字、数字、英字
及び数種の特殊文字を各一文字づつ書いた帳票を、学習
用の事例として準備する。
【0038】その後、帳票上の各文字を、光学的文字パ
ターン読み取り装置で、文字パターンデータとして取り
込み、事例データセット17とする。事例データセット
は、見本学習入力部10で各文字種に分類され、文字種
見本記憶部11により各文字種ごとにLVQ法のニュー
ラルネットワークによりパターン分類され、代表的な文
字パターンが荷重ベクトルとして記憶される。また、前
記文字種見本記憶部11の学習が終了すると見本間相関
学習入力部12により各人ごとの事例データセットとし
て分けられ、該文字パターンは文字種見本記憶部11内
の該当する文字種見本群に入力される。文字種見本群の
出力データは、パックプロパゲーション法によるニュー
ラルネットワークである見本間相関記憶部13に入力さ
れる。入力されたデータは、文字種見本群に入力された
事例データセットの文字パターンを教師信号として学習
する。
【0039】文字種見本記憶部11及び見本間相関記憶
部13の学習が終了した後、認識したい文字パターン列
18が主文字認識部16に入力される。主文字認識部1
6は、文字種が確定している文字パターンと文字種が確
定できない文字パターンに分けられる。ここで、住所を
意味する次のような入力文字列パターンが主文字認識部
16に入力されたとする。
【0040】 ’カワサキシ サイワイク ヤナギチョウ 70’ 主文字認識部によって、前記文字列の内、次の文字種が
確定し、その他の文字種は確定できなかったとする。
【0041】 「カ サキ イ ヤナギチョウ 0」 主文字認識部16は、確定した文字パターンと該文字パ
ターンの文字種を対として出力する。
【0042】出力された文字パターンと該文字種の対
は、文字種見本記憶部11に入力され、次に文字パター
ンが該文字種の文字種見本群に入力される。前記入力文
字種が前記該当する文字種見本群に入力されると、該文
字種が確定されている文字パターンに近い見本を記憶し
ている出力素子が反応する。次に、前記出力素子の反応
結果を見本間相関記憶部13に入力する。同じことを主
文字認識部16から出力される確定された文字種の文字
パタ−ンの全てについて行う。このようにして、確定さ
れた入力文字種全ての見本は、見本間相関記憶部13に
入力され、見本間相関記憶部13の出力素子には、確定
された文字種に対応する見本パターンと、該見本パター
ンと高い相関をもつ確定されていない文字種に対応する
見本パターンが現れる。現れた見本パターンの列を文字
パターン18を書いた筆者の書き癖として推定し、その
推定結果を癖推定部14に入力し、記憶する。
【0043】癖推定部14は、確定できなかった文字パ
ターン、例えば’ワ’と、前記推定された書き癖の結果
との類似性を各文字種について順次計算する。計算結果
を文字種判定部15に出力する。文字種判定部15は、
類似性の最も高かった見本の文字種を文字パターン’
ワ’の文字種として判定する。さらに、残りの確定でき
なかった文字パターン’シ’、’サ’、’ワ’、’
イ’、’ク’、’7’についても同様に文字種を判定す
る。
【0044】このようにして、主文字認識部16で確定
できなかった文字パターンの文字種が確定され、認識す
べき入力文字パターン列18の全ての文字が認識される
ことになる。
【0045】すなわち、本発明は、文字種をはっきりと
判定できる文字パターンをみて、筆者の文字種の書き癖
を知り、その癖によって他の文字種の書き癖を推定し、
推定された癖に基づいて、判定の困難なパターンの文字
種を判定する人間の文字種判定方法を取り入れ、該人間
の書き癖の推定を相関を利用して行うものである。
【0046】なお、本実施例では、文字種が確定された
文字パターンと確定されていない文字パターンの分類を
従来の複合類似度法等による文字認識のみの出力結果を
利用したが、さらに後処理、例えば知識処理等により、
文字種の判定が難しい文字パターンの推定が行えれば、
該推定結果を利用することにより、確定される文字種が
増加し、より確かな書き癖が推定できるため、全体の認
識率はさらに向上する。
【0047】
【発明の効果】以上説明したように、本発明は、特定の
人が記述した文書中の文字に対して文字種が確定してい
る文字パターンと文字種が不確定な文字パターンに分類
することができる文字認識手段を具備した文字認識装置
において、多数の人が記述した一連の文字データセット
群を文字種ごとに学習してパターン分類し、代表的な文
字パターンを文字種見本として文字種ごとに記憶する文
字種見本記憶手段と、前記一連の文字データセット群に
対し、各人の文字データセットごとに前記文字種見本を
当てはめて一連の文字種見本データセットを作成し、該
文字種見本データセット単位の相関を学習して記憶する
書き癖相関記憶手段とを有し、前記文字種が確定してい
る一連の文字パターンの全てに対して、前記文字種見本
記憶手段に記憶されている文字種見本を検索して該当す
る文字種見本を当てはめ、前記特定の人の文字種見本デ
ータセットを作成した後、前記書き癖相関記憶手段に記
憶されている書き癖と相関をとり、前記特定の人の書き
癖を推定し、前記文字種が不確定な文字パターンと推定
された特定の人の書き癖データを比較して該不確定な文
字パターンの文字種を判定するようにしているので、文
字認識率、特に手書き文字認識率が向上する利点を有す
る。
【0048】さらに、文字認識率が向上するため、認識
できない文字を後処理する人手にかかる人件費を削減で
きる利点を有する。
【0049】また、文字の誤判定により発生する不都合
を軽減することにより、事務効率の向上が図れる利点を
有する。
【0050】さらに、知識処理等の後処理結果を利用す
ることにより、全体的な文字認識率を向上することもで
きる利点を有する。
【図面の簡単な説明】
【図1】本発明による一実施例である文字認識装置の構
成ブロック図。
【図2】前記実施例における文字種見本記憶部の構成を
示す図。
【図3】前記文字見本記憶部における出力素子の反応特
性の概形を示す図。
【図4】前記実施例における見本間相関記憶部の構成を
示す図。
【図5】従来の文字認識装置の概要構成ブロック図。
【図6】手書き文字パターンの一例を示す図。
【符号の説明】
1 学習プロセス部 2 判定プロセス部 10 見本学習入力部 11 文字種見本記憶部 12 見本間相関学習入力部 13 見本間相関記憶部 14 癖推定部 15 文字種判定部 16 主文字認識部 17 文字データセット 18 認識すべき入力文字パターン列 19a 出力される確定された文字種 19b 出力される本発明により判定された文字種 I1〜In 学習入力文字パターン G1〜Gn 文字種見本記憶部の入力層 P1〜Pn 文字種見本記憶部の出力層 S1〜Sn 文字種見本群記憶部 PP1〜PPn 見本間相関記憶部の入力層 GG1〜GGn 見本間相関記憶部の出力層 T1〜Tn 教師文字パターン 51 文字入力部 52 文字パターンデータ変換部 53 複合類似度計算部 54 判定部 55 知識処理部 56 認識文字出力部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】記述された文書中の文字に対して文字種が
    確定している文字パターンと文字種が不確定な文字パタ
    ーンに分類することができる文字認識手段を具備した文
    字認識装置において、 記述された一連の文字データセット群を文字種ごとにパ
    ターン分類し、代表的な文字パターンを文字種見本とし
    て文字種ごとに記憶する文字種見本記憶手段と、 前記一連の文字データセット群に対し、前記文字データ
    セットごとに前記文字種見本を当てはめて一連の文字種
    見本データセットを作成し、該文字種見本データセット
    単位の相関をとって記憶する特徴相関記憶手段と、 前記文字種が確定している一連の文字パターンの全てに
    対して、前記文字種見本記憶手段に記憶されている文字
    種見本を検索して該当する文字種見本を当てはめ、前記
    特定の文字種見本データセットを作成した後、前記特徴
    相関記憶手段に記憶されている特徴と相関をとり、前記
    特定の文字データセット群の特徴を推定する特徴推定手
    段と、 前記文字種が不確定な文字パターンと前記特徴推定手段
    により推定された特定の特徴データを比較して該不確定
    な文字パターンの文字種を判定する文字種判定手段とを
    具備することを特徴とする文字認識装置。
  2. 【請求項2】前記文字種見本記憶手段及び前記特徴相関
    記憶手段をニューラルネットワークにより構成すること
    を特徴とする前記請求項1記載の文字認識装置。
JP4052762A 1992-03-11 1992-03-11 文字認識装置 Pending JPH05258117A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4052762A JPH05258117A (ja) 1992-03-11 1992-03-11 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4052762A JPH05258117A (ja) 1992-03-11 1992-03-11 文字認識装置

Publications (1)

Publication Number Publication Date
JPH05258117A true JPH05258117A (ja) 1993-10-08

Family

ID=12923894

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4052762A Pending JPH05258117A (ja) 1992-03-11 1992-03-11 文字認識装置

Country Status (1)

Country Link
JP (1) JPH05258117A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5972501A (en) * 1996-05-20 1999-10-26 Kuraray Co., Ltd. Easily fibrillatable fiber
JP2008219825A (ja) * 2007-03-08 2008-09-18 Fuji Xerox Co Ltd 情報処理装置、画像処理装置、画像符号化装置、情報処理プログラム、画像処理プログラム及び画像符号化プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5972501A (en) * 1996-05-20 1999-10-26 Kuraray Co., Ltd. Easily fibrillatable fiber
JP2008219825A (ja) * 2007-03-08 2008-09-18 Fuji Xerox Co Ltd 情報処理装置、画像処理装置、画像符号化装置、情報処理プログラム、画像処理プログラム及び画像符号化プログラム

Similar Documents

Publication Publication Date Title
Senior A combination fingerprint classifier
CN110609891B (zh) 一种基于上下文感知图神经网络的视觉对话生成方法
Pal et al. Handwritten English character recognition using neural network
Prabhakar et al. Decision-level fusion in fingerprint verification
JP2940933B2 (ja) パターン認識方式
EP0355748A2 (en) A pattern recognition apparatus and method for doing the same
US5917941A (en) Character segmentation technique with integrated word search for handwriting recognition
Rahman et al. Multiple classifier combination for character recognition: Revisiting the majority voting system and its variations
CA2375355A1 (en) Character recognition system and method
JP2673871B2 (ja) ニューラル・ネットワークによるパターン認識方法及び装置
Abuzaraida et al. Recognition techniques for online arabic handwriting recognition systems
CN112988970A (zh) 一种服务于智能问答系统的文本匹配算法
CN118197434B (zh) 一种dna启动子及其强度的两阶段预测方法
JP2924958B2 (ja) 指紋カード絞り込み装置及び指紋カード絞り込み方法
Murase et al. Online hand-sketched figure recognition
Toh Fingerprint and speaker verification decisions fusion
Kessentini et al. Word spotting and regular expression detection in handwritten documents
Cao et al. Handwritten numeral recognition with multiple features and multistage classifiers
JPH05258117A (ja) 文字認識装置
CN115018006A (zh) 一种基于Dempster-Shafer框架的分类方法
CN116450781A (zh) 问答的处理方法及装置
JPH08115387A (ja) パターン認識装置
Habib et al. OCR recognition system for degraded urdu and devnagari script
CN117523685B (zh) 基于非对称对比融合的双模态生物特征识别方法及系统
Javed Investigation into a segmentation based OCR for the Nastaleeq writing system