JPS6120038B2 - - Google Patents

Info

Publication number
JPS6120038B2
JPS6120038B2 JP56138163A JP13816381A JPS6120038B2 JP S6120038 B2 JPS6120038 B2 JP S6120038B2 JP 56138163 A JP56138163 A JP 56138163A JP 13816381 A JP13816381 A JP 13816381A JP S6120038 B2 JPS6120038 B2 JP S6120038B2
Authority
JP
Japan
Prior art keywords
word
characters
character
candidate
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP56138163A
Other languages
English (en)
Other versions
JPS5839377A (ja
Inventor
Yoshiaki Kurosawa
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Shibaura Electric Co Ltd filed Critical Tokyo Shibaura Electric Co Ltd
Priority to JP56138163A priority Critical patent/JPS5839377A/ja
Publication of JPS5839377A publication Critical patent/JPS5839377A/ja
Publication of JPS6120038B2 publication Critical patent/JPS6120038B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 本発明は、例えば手書入力されたn文字からな
る単語を簡易に且つ効果的に認識し得る文字認識
装置に関する。
文字を認識する場合、基本的にはその文字の特
徴を検出して行なわれるが、n文字からなる単語
を認識するとき、個々の文字をそれぞれ認識し、
その結果を組合せるだけでは不十分なことが多
い。また或る文字の認識が不十分な場合にはその
単語を認識することが困難となることもある。そ
こで従来では、第1図に示すように認識装置を構
成し、有意の単語数が限られることを利用して
個々の文字認識が不十分な場合であつてもその単
語を認識するような工夫が施されている。即ち、
文字入力部1を介して与えられるn文字の文字列
からなる単語を認識部2に導びいて文字認識す
る。この認識が困難な場合には、その単語に対す
る複数の候補カテゴリを求めて単語照合部3に与
える。この単語照合部3では、上記候補カテゴリ
の中の単語として有意な組合せを、単語辞書4に
登録された単語データ・ベースの中から探し出
し、これによつて正しい単語の選択を行ないその
単語の認識を行う。このような認識処理によれ
ば、個々の文字に対する認識結果が不完全であつ
ても、その候補カテゴリの組合せによつて有意な
単語を選び出すことができ、結果として効果的な
単語認識が可能となる。然し乍ら、文字認識によ
つて得られる候補カテゴリが多い場合、その組合
せが膨大となる為に、単語データ・ベースとの照
合に極めて多大な時間を要すると云う不具合があ
る。
本発明はこのような事情を考慮してなされたも
ので、その目的とするところは、簡易に且つ高速
度に単語データ・ベースと候補カテゴリとの比較
を行つて単語認識を効果的に行うことのできる文
字認識装置を提供することにある。
即ち本発明はn文字からなる入力単語の各文字
につきそれぞれr個の候補カテゴリ(文字コー
ド)を求め、単語辞書に登録された単語の各文字
と上記候補カテゴリとを単語文字位置毎に比較し
て、その一致した候補カテゴリの候補順位あるい
はその類似度から上記比較された単語の入力単語
に対する一致度を計算し、一致度の高いx個の単
語を候補単語として選び出すことによつて認識候
補となる単語を厳選し、これによつて高速で適確
な認識を簡易に行うことを可能として上述した目
的を効果的に達成したものである。
以下、図面を参照して本発明の実施例につき説
明する。
第2図は実施例装置の概略構成図である。n文
字からなる文字列として与えられる入力単語は、
認識部11にて各文字につきそれぞれ認識され、
それぞれr個の候補カテゴリ(文字コード)が求
められる。これらの候補カテゴリは、その候補順
位に応じて第1位から第r位まで各単語文字位置
毎に定められる。尚候補カテゴリがk(<r)個
しか求められない場合には、(r−k)個のダミ
ーの候補カテゴリを設定しても良く、或いはk個
の候補カテゴリのみを対象として以下に示す処理
を行うようにしても良い。この際、各候補カテゴ
リの文字に対する類似度、つまり候補カテゴリの
標準文字パターンと入力文字パターンと文字パタ
ーンとが似ている度合(類似度)をそれれぞれ求
め、この類似度と候補カテゴリとを一体的に扱う
ようにしてもよい。かくして、認識部11によつ
て求められたn文字に対するそれぞれr個の候補
カテゴリの組合せによつて得られる認識対象単語
はrnとなる。そして、これらの候補カテゴリ
は、編集部12を介して単語照合部13に与えら
れる。
一方、単語辞書14には単語データベースとし
てn文字からなるLnの単語が予め登録されてい
る。これらの単語は順次読出されて前記単語照合
部13に与えられ、認識処理に供される。
さて単語照合部13は、基本的には次のように
構成される。前記認識部11を介して認識された
n文字に対するr個の候補カテゴリ、つまりn×
r個の候補カテゴリは候補文字レジスタ21に格
納される。またアドレスカウンタ22の制御を受
けて単語辞書14から読出される単語は単語辞書
レジスタ23に格納される。この単語辞書レジス
タ23に格納された単語の各文字はコンパレータ
24に供給され、レジスタカウンタ25の制御を
受けて候補文字レジスタ21から順次読出される
候補カテゴリと単語文字位置に対応して一致比較
される。このコンパレータ24によつて単語文字
と候補カテゴリとの一致比較や単語文字位置毎に
行われる。そして、その一致検出情報は一致計算
部26に与えられ、この計算部26にて前記レジ
スタ23に格納されて比較に供された単語の入力
単語に対する一致度が計算されている。この一致
度計算は、例えば一致した候補カテゴリのその文
字における候補順位を各単語文字位置毎に求め、
その候補順位情報の総合値を求める等して行われ
る。また前記したように候補カテゴリについてそ
の類似度が求められている場合には、各単語文字
位置毎に一致検出された候補カテゴリの類似度の
総和値として一致度を求めるようにしてもよい。
尚、この一致比較によつていずれかの単語文字位
置において一致する候補カテゴリが見出されれな
い場合には、その単語に対する一致性がないもの
として取扱うようにすればよい。そして、このよ
うな単語の一致度計数値は、単語辞書14から単
語を読出す都度繰返して行なわれ、Ln個の全て
の単語につき、その一致度が求められる。しかし
て、このようにして求められた各単語の入力単語
に対する一致度の情報はソート処理部に導びか
れ、一致度の高いものから順にソート処理され
る。そして、一致度の高いx個の単語が候補単語
として編集部12に与えられる。この編集部12
では、これらの候補単語と入力単語の認識情報と
を総的に編集し、最終的な認識結果、つまり入力
単語の認識結果情報(単語)を得ている。
ところで、このような照合処理は、具体的には
次のようにして行なわれる。第3図はその一例を
示すもので、候補文字レジスタ21は、n行r列
の記憶エリアを持つシフトレジスタにより構成さ
れる。しかして、n文字につきそれぞれ認識され
た候補カテゴリは、n行に単語文字位置を対応さ
せ、その候補順位に従つてr列に亘つて順次格納
される。そして、これらの格納された候補カテゴ
リは、カウンタ25の制御を受けて1列毎に並列
的に読出され、コンパレータ24に与えられる。
またこのコンパレータ24にはレジスタ23から
単語の各文字データが単語文字位置対応して並列
的に与えられている。これによつて、各単語文字
位置において、候補カテゴリと単語文字との同時
対比が行われる。そして、一致結果を得た単語文
字位置からその情報が一致度計算部26に与えら
れ、そのときのカウンタ25の計数値が候補順位
情報として取込まれる。そして、1回の比較が終
了したとき、カウンタ25が歩進されて次の1列
の候補カテゴリがコンパレータ24に与えられ、
同様にして一致検出が行われる。そして、この一
致検出は、r回繰返して行われ、これによつてレ
ジスタ23に格納された単語に対する照合処理を
終える。
このとき、一致度計算部26には各単語文字位
置毎に一致検出された候補カテゴリを示すカウン
ト値、つまり候補順位の情報が求められる。この
情報に従つて、レジスタ23に格納された単語の
入力単語に対する一致度が求められている。ソー
ト処理部27は、このときのアドレスカウンタ2
2のカウント値から、上記一致度が求められた単
語を認識しており、その一致度の高い単語を示す
上記カウント値と共に、その単語に対する一致度
の情報を格納している。そして、次に入力された
単語の一致度と、先に入力された単語の一致度と
を比較し、一致度の低い単語情報を切捨てると共
に、その並び換えを行う等してソート処理を行つ
ている。
尚、この場合、レジスタ21に格納した候補カ
テゴリに対応して、その類似度情報を別の記憶エ
リアに格納しておき、一致度計算を前記した候補
順位に代えて類似度情報に従つて行うようにして
もよい。
また、この第3図に示す構成では、照合処理を
各単語文字位置につき並列的に同時に実行するよ
うにしたが、第4図に示すようにシリアルに実行
するようにしても良い。即ち候補文字レジスタ2
1をn×r個の記憶エリアをもつものとし、これ
らの記憶エリアに候補カテゴリを順に格納するよ
うに構成する。尚ここでは候補カテゴリと共に類
似度情報も格納するようにしたものを示す。そし
て、上記候補カテゴリをカウンタ25のアドレス
制御により順次読出してコンパレータ24に供給
すると共に、レジスタ23に格納された単語の各
文字セレクタ28を介して順次読出すようにす
る。この場合、第1位の文字をセレクトしてその
文字位置における候補文字を順次読出して一致検
出し、その後第2位の文字をセレクトしてその文
字位置の候補カテゴリに対する一致検出を行うよ
うに、カウンタ25のアドレス制御と、セレクタ
28のセレクト制御を同期させるようにすればよ
い。このようにしても、先の例と同様に照合処理
を行うことができる。
かくして上述したような照合処理を行い、一致
度の高い候補単語を選出することによつて、極め
て精度の高い認識が可能となる。しかも、各文字
に対するr個の候補カテゴリに対して照合処理を
行うので、高速度に簡潔に精度の高い認識が可能
である。従つて極めて効果的な、実用性の高い文
字認識が可能となる等の絶大なる効果を奏する。
尚、本発明は上記した実施例以外に種々変形し
て実施することが可能である。例えば候補文字レ
ジスタ21に格納するデータをn×r個の候補カ
テゴリだけではなく、分類等を示す属性データを
付加したものとし、単語辞書内を領域分割して分
類項毎にその属性に属する単語を登録しておけ
ば、辞書の照合範囲をしぼることができ、認識処
理の効率向上を図ることが可能となる。また単語
辞書に登録する単語にその属性を付加しておき、
属性が一致しない単語については認識対象から除
外するようにしてもよい。このようにすれば単語
選択の誤りを減少させることが可能となる。
また、単語辞書に、単語の文字コードと共に、
結果として出力する単語の属性、例えば単語に対
応して定められる特殊なコードを登録しておけ
ば、文字認識対象外の文字を含む単語も認識する
ことが可能となる。即ち、単語に含まれる認識対
象外の文字をその文字に似た認識対象の文字に置
換え、この置換えられた単語を辞書に登録する。
そして、この単語には本来の正しい単語を属性と
して付加しておき、この単語が認識されたとき、
上記属性として付加された単語を出力するように
すればよい。このようにすれば、見掛上、認識対
象以外の文字を含む単語をも幅広く認識すること
が可能となる。
更には、上記した属性のみならず、単語の図形
としての特徴、つまり複雑さ(ストローク数)や
ループ数(黒で囲まれた領域数)等の情報を併用
して認識処理するようにしてもよい。また単語の
使用頻度の情報も登録して、使用頻度の高い単語
については高い一致度を得るようにして、実用的
な照合を行なわせるようにしてもよい。要するに
本発明は、その要旨を逸脱しない範囲で種々変形
して実施することができる。
以上説明したように本発明によれば、候補カテ
ゴリによつて示される候補文字と単語辞書とをレ
ジスタに格納して、高速度な照合処理を行い、そ
の一致度を求めるので、短時間に効率良く精度の
高い単語認識を行い得る。しかも与えられた単語
の文字品質が悪い場合であつても、十分精度の高
い認識が可能であり、実用的利点が高い。また単
語辞書の構成の単純化と、その作成変更が容易で
ある等の効果も奏する文字認識装置をここに提供
することができる。
【図面の簡単な説明】
第1図は従来装置の一例を示す概略構成図、第
2図は本発明の一実施例装置の概略構成図、第3
図および第4図はそれぞれ単語照合部の基本的な
構成例を示す図である。 11……認識部、12……編集部、13……単
語照合部、14……単語辞書、21……候補文字
レジスタ、22……アドレスカウンタ、23……
単語辞書レジスタ、24……コンパレータ、25
……レジスタカウンタ、26……一致度計算部、
27……ソート処理部、28……セレクタ。

Claims (1)

  1. 【特許請求の範囲】 1 n文字からなる入力単語の各文字につき認識
    して上記各文字に対するr個の認識候補文字をそ
    れぞれ求め、これらのr×n個の認識候補文字を
    上記各文字に対応してそれぞれ記憶するレジスタ
    と、 単語辞書に予め登録されたn文字からなる単語
    を順次抽出し、その単語を形成する文字と上記認
    識候補文字とをその文字位置毎にそれぞれ比較す
    る手段と、 各文字位置で認識候補文字の一致が検出された
    とき、その認識候補文字の候補順位に対応する情
    報を加算して求められる総和を上記単語の前記入
    力単語に対する一致度として求める手段と、 前記単語辞書から順次抽出されたn文字の各単
    語についてそれぞれ求められた上記一致度を相互
    に比較して一致度の高いx個の単語を前記入力単
    語の認識候補単語として選択する手段とを具備し
    たことを特徴とする文字認識装置。 2 n文字からなる入力単語の各文字につき認識
    して上記各文字に対するr個の認識候補文字とそ
    の類似度をそれぞれ求め、これらのr×n個の認
    識候補文字と類似度とを上記各文字に対応してそ
    れぞれ記憶するレジスタと、 単語辞書に予め登録されたn文字からなる単語
    を順次抽出し、その単語を形成する文字と上記認
    識候補文字とをその文字位置毎にそれぞれ比較す
    る手段と、 各文字位置で認識候補文字の一致が検出された
    とき、その認識候補文字について求められた類似
    度を加算して求められる総和を上記単語の前記入
    力単語に対する一致度として求める手段と、 前記単語辞書から順次抽出されたn文字の各単
    語にいてそれぞれ求められた上記一致度を相互に
    比較して一致度の高いx個の単語を前記入力単語
    の認識候補単語として選択する手段とを具備した
    ことを特徴とする文字認識装置。
JP56138163A 1981-09-02 1981-09-02 文字認識装置 Granted JPS5839377A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56138163A JPS5839377A (ja) 1981-09-02 1981-09-02 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56138163A JPS5839377A (ja) 1981-09-02 1981-09-02 文字認識装置

Publications (2)

Publication Number Publication Date
JPS5839377A JPS5839377A (ja) 1983-03-08
JPS6120038B2 true JPS6120038B2 (ja) 1986-05-20

Family

ID=15215492

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56138163A Granted JPS5839377A (ja) 1981-09-02 1981-09-02 文字認識装置

Country Status (1)

Country Link
JP (1) JPS5839377A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11390953B2 (en) 2016-04-14 2022-07-19 Toppan Printing Co., Ltd. Vapor deposition mask base material, vapor deposition mask base material manufacturing method, and vapor deposition mask manufacturing method
US11499235B2 (en) 2017-10-13 2022-11-15 Toppan Printing Co., Ltd. Vapor deposition mask substrate, vapor deposition mask substrate manufacturing method, vapor deposition mask manufacturing method, and display device manufacturing method

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5856189A (ja) * 1981-09-30 1983-04-02 Comput Basic Mach Technol Res Assoc 文字認識装置
JPS58154899A (ja) * 1982-03-10 1983-09-14 日本電気株式会社 単語認識装置
JPH0614375B2 (ja) * 1983-12-23 1994-02-23 株式会社日立製作所 文字入力装置
JPS60189582A (ja) * 1984-03-09 1985-09-27 Fujitsu Ltd 文字認識後処理方式
JPH0746373B2 (ja) * 1986-10-21 1995-05-17 日本電信電話株式会社 単語認識装置
JPH0795332B2 (ja) * 1988-01-06 1995-10-11 株式会社東芝 文字列読取装置
JPH0738212B2 (ja) * 1988-01-18 1995-04-26 株式会社東芝 文字認識装置
JPH07117994B2 (ja) * 1988-02-10 1995-12-18 沖電気工業株式会社 文字認識後処理方法
JPH0217573A (ja) * 1988-07-06 1990-01-22 Mitsubishi Electric Corp フアイル装置
JP2560959B2 (ja) * 1993-01-12 1996-12-04 日本電気株式会社 文字認識後処理方式
CN1303564C (zh) * 2003-06-12 2007-03-07 摩托罗拉公司 改进的电子设备中字符输入的识别方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5839378A (ja) * 1981-09-01 1983-03-08 Fujitsu Ltd 文字認識後処理方式

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5839378A (ja) * 1981-09-01 1983-03-08 Fujitsu Ltd 文字認識後処理方式

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11390953B2 (en) 2016-04-14 2022-07-19 Toppan Printing Co., Ltd. Vapor deposition mask base material, vapor deposition mask base material manufacturing method, and vapor deposition mask manufacturing method
US11499235B2 (en) 2017-10-13 2022-11-15 Toppan Printing Co., Ltd. Vapor deposition mask substrate, vapor deposition mask substrate manufacturing method, vapor deposition mask manufacturing method, and display device manufacturing method

Also Published As

Publication number Publication date
JPS5839377A (ja) 1983-03-08

Similar Documents

Publication Publication Date Title
JP2637344B2 (ja) 記号認識方法及び装置
US4685142A (en) Method and device for handwritten letter recognition
CA2222590C (en) System and method for reducing the search scope in a lexicon
US5267332A (en) Image recognition system
US7711736B2 (en) Detection of attributes in unstructured data
US5579408A (en) Character recognition method and apparatus
US6978044B2 (en) Pattern string matching apparatus and pattern string matching method
JPS6120038B2 (ja)
Al-Maadeed et al. Automatic handedness detection from off-line handwriting
JPH04326164A (ja) データベース検索システム
JPH0766423B2 (ja) 文字認識装置
JPH0474756B2 (ja)
JPS5953986A (ja) 文字認識装置
EP0519737A2 (en) Image recognition system
JPH08227427A (ja) 文字認識装置
JP2671984B2 (ja) 情報認識装置
JP2923295B2 (ja) パターン同定処理方式
JPH07262322A (ja) 文字認識方法及び文字認識装置
JPH0795337B2 (ja) 単語認識方式
JPH05225248A (ja) データベース検索システム
CN114387974A (zh) 一种基于声纹识别的串案方法、系统、装置及存储介质
JP2868770B2 (ja) パターン辞書の構成方式
JPS6344287A (ja) 文字読取装置
JPH06180767A (ja) 文字認識装置
JPS63268082A (ja) パタ−ン認識装置