JPS5953986A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPS5953986A
JPS5953986A JP57163402A JP16340282A JPS5953986A JP S5953986 A JPS5953986 A JP S5953986A JP 57163402 A JP57163402 A JP 57163402A JP 16340282 A JP16340282 A JP 16340282A JP S5953986 A JPS5953986 A JP S5953986A
Authority
JP
Japan
Prior art keywords
word
character
candidate
registered
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57163402A
Other languages
English (en)
Inventor
Yoshiaki Kurosawa
由明 黒沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Tokyo Shibaura Electric Co Ltd filed Critical Toshiba Corp
Priority to JP57163402A priority Critical patent/JPS5953986A/ja
Publication of JPS5953986A publication Critical patent/JPS5953986A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は、例えば手書入力されたn文字からなる単語を
簡易に且つ効果的に認識し得る文字認識装置に関する。
〔発明の技術的背景とその問題点〕
文字を認識する場合、基本的にはその文字の特徴を検出
して行われるが、n文字からkる単語を認識するとき、
個々の文字をそれぞれ認識し、その結果を組合せるだけ
で仁1:不十分なとノーが多い。また成る文字の認識が
不十分な場合にはその単語を認識することが困難となる
こともある。そこで従来では、第1図に示すように認識
装置を構成し、有意の単語数が得られることを利用して
個々の文字認識が不十分な場合であってもその単語を認
識するような工夫が施されている。即ち、文字入力部1
を介して与えられるn文字の文字列からなる単語を認識
部2に導ひいて文字nB HWくする。この認識が困難
々場合にd、その単語に対する複数の候補カテゴリを求
めてllj語照合部3に与える。この単語照合部3てな
よ、上記候補カテゴリの中の単語として有意な組合せを
、単語辞書4に登録された単語の中〃・ら探し2出し7
、これによって正しい単語の選択を行いその単語の認識
を行う。このような認識処理によれば、個りの文字に対
する認識結果が不完全であっても、その候補カテゴリの
組合せによって有意な単語を選び出すことができ、結果
と17−C効果的な単語認識が可能となる。
然し乍ら、とのような手法を漢字認識等に応用[7だ1
8合、次のような問題が生じる。即ち、漢字の字種は非
常に多く、例えばJIBコードの第1水準として定めら
れているものだけでも約3000字ある。この為、前述
した認識部2でその全てを認識することは極めて困難で
あり、一般的には出現頻度の高い文字種についてのみ認
識することに外る。これ故、認識部2が認識することの
できない、つまり読取対象外の文字を含む単語が入力さ
れた場合には、その単語認識が不可能になると云う不具
合が生じた。
〔発明の目的〕
本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、簡易に且つ確実に単語辞書と候
補カテコ゛りとの比較を行ってその単語を認識すること
ができ、しかも文字認識部の読取対象外の文字を含む単
語でろ一つでもこれを効果的に認識することのできる実
用性の高い文字認識装置を提供するととにある。
〔発明の概要〕
本発明は単語辞書として認識対象とする単語を登録して
おくと共に、その単語が文字認識部の読取対象外の文字
を含むときにd:、該文字を読取対象とする文字で、且
つその文字に類似した文字にて置換して作成された単語
を前記認識対象とする単語に対応して登録しておき、前
記文字認識部を介して入力された入力単語の候補カテコ
゛りと前記単語静間に登録された単語とをその甲−語文
字位価毎に照合比較し、て前記入力単語を認識ずZ)、
rうにしたものである。そして、認識さhた4j語が前
配置換処理により作成された単語であ7)どきには、こ
れに代えて元の単語を認識結果と−1−るようにしたも
のである。
〔発明の効果〕
従って不発、明によれば、n文字からなる文字列と1〜
で表わされる弔語を非常に良好に、且つ安定確実に認識
することが可能と在る。
しかも、文字認識部が読取り対象としない文字を含む単
語についても、これを効果的に認識ずみことが可能とな
り、従って漢字単語の認識等に絶大なる効果が奏せられ
、その実用的利点が極めて大きい。
〔発明の実hイ[i例〕
1刃、下、図面を葱照して本発明の実施例につき説明−
トる。
第2し1は実/IFIi例装(ぺのPit略構成図であ
る。n文字からな7・文字列と(〜てlう、ぐ−Cつれ
る入力部6Ijは、認識部1〕にて各文字につきそれぞ
れ874 Jeされ、それぞれr個の候補カテゴリ(文
字コード)が求められる。これらの候補カテゴリは、そ
の候補順位に応じて第1位から第1位1で各単語文字位
置毎に定められる。尚、このとき各候補カテゴリの文字
に対する類似度、つ壕り候補カテゴリの標準文字パター
ンと入力文字パターンとが似ている度合をそれぞれ求め
、この類似度と候補カテゴリとを一体的に扱うようにし
てもよい。かくして、認識部11によって求められたn
文字に対するそれぞれr個の候補カテゴ8りの組合せに
よって得られる認識対象単語はrn個となる。そして、
これらの候補力テコ゛りは、編集部12を介して単語照
合部13に与えられる。
一方、単語辞書ノ4には認識対象単語としてn文字から
なるLn個の単語が予め登録されている。これらの単語
は順次読出さJlて前記単語照合部13に与えられ、認
識処理に供される。
尚、」1記認識対象とする単語が認識部Iノの読取対隼
外の文字を含むとき、その文字を後述するように置、換
して作成された単語が単語辞書14に登録される。
さて、単語照合部131rよ、基本的には次のように構
成される。前記認識部1ノを介して認識されノ’c n
文字に対する1個の候補カテゴリ、つまりnXr個の候
補カテゴリは候補文字レジスタ2ノに格納される。寸た
アドレスカウンタ22の制御を受けて単語辞書14から
読出される4(Knは単語辞書レジスタ23に格納され
る。
この111語辞書レジスタ23に格納された単語の各文
字はコンパ1/−夕24に供給され、レジスタカウンタ
25の制御を受けて候補文字レジスタ2)から順次読出
される候補カテゴリと単語文字位置に対応して一致比較
される。このコンパレータ24によって単語文字と候補
カテゴリとの一致が単語文字位置毎に行われる。そして
、その一致検出情報は一絞度計算部26に与えらfl、
この計算部26にて前記レジスタ23に格納されて比較
に供された単語の入力単語に対する一致度が計算されて
いる。この−絞度1算は、例えば一致した候補カテゴリ
の候補順位を各単語文字位置毎に求め、その候補順位情
報の総合値を求める等し7て行われる。捷た前記したよ
うに候補カテゴリについてその類似度が求められている
場合には、各単語文字位置毎に一致検出された候補カテ
ゴリの類似度の総和値として一致度を求めるようにして
もよい。尚、この一致比較によっていずれかの単語文字
位置において一致する候補カテゴリが見出されない場合
には、その単語に対する一致性がないものとして取扱う
ようにすればよい。そして、このような単語の一致度計
算は、単語辞書14から単語を読出す都度繰返して行わ
れ、Ln個の全ての単語につき、その一致度が求められ
る。しかして、このようにして求められた各単語の入力
単語に対する一致度の情報はソート処理部に導ひかれ、
一致度の高いものから順にソート処理される。
ところで、このよう々照合処理は、其体的には次のよう
にして行われる。第3図はその一例を示すもので、候補
文字レジスタ/! J l;I、n行r列の記憶エリア
を持つンフトレノスタにより41〜成される。しか[,
7て、n文字につきそれぞれ認識さりだ候補カテゴリは
、n行に単語文字位16を対応さぜ、その候補順位に従
ってr列に亘ってハ「【次格納さ:1する。ぞして、こ
れらの格納された候補カテゴリは、カウンタ25の制御
を受けて1列毎に並列的に読出され、コン/9レータ2
4に力えられる。寸だこのコン/9レータ24にはレジ
スタ23から単語の各文字データが単語文字位置、対応
して並列的に力えられている。
これによって、各単語文字位置において、候補カテゴリ
と単語文字との同時対比が行われる。
そして、一致結果を得た単語文字位置からその情報が一
絞度計算部26に力えられ、そのときのカウンタ25の
計数値が候補順位情報として取込まれる。そしC11回
の比較が終了したとき、カウンタ25が歩進されて次の
1列の候補カテゴリがコン15?レータ24に与えられ
、同4采にしで−・改検出が行われる。そして、この一
致検出は、1回繰返して行われ、これによってレジスタ
23に格納された単語に対する照合処理を終える。
このとき、−絞度計算部26には各単語文字位fit毎
に一致検出された候補カテコ゛りを示すカウント値、つ
捷り候補順位の情報が得られて於り、この情報に従って
、レジスタ23に格納された単語の入力単語に対する一
致度が求められている。ソート処理部27は、このとき
のアドレスカウンタ22のカウント値から、上記一致度
が求められた単語を認識しており、その一致度の高い単
語を、一致度とカウント値として格納している。そして
、次に入力された単語の一致度と、先に入力された単語
の一致度とを比較し、一致度の低い単語情報を切捨てる
と共に、その並び換えを行う等してソート処理を行って
いる。
尚、この場合、レジスタ21に格納した候補カテゴリに
対応して、その類似度情報を別の君己憶エリアに格納し
ておき、−軟度計算を「)0己しだ候補順位に代えて類
似度情報に従って行うようにしてもよい。
また、この第3図に示す構成では、照合処理を各単語文
字位置につき並列的に同時に実行するようにしだが、第
4図に示すようにシリアルに実行するようにしてもよい
。即ち候補文字レジスタ21をnXr個の記憶エリアを
もつものとし、これらの記憶エリアに候補カディリを順
に格納するように構成する。尚ここでは候補カテコ゛り
ど共に類似度情報も格納するようにしたものを示す。そ
j7て、上記候補カテゴリをカウンタ25のアドレス制
御によシ順次読出してコンパ1/−夕24に供給すると
共に、レジスタ23に格納された単語の各文字をセレク
タ28を介して順次読出ずようにする。この場合、第1
位の文字をセレクトしてその文字位置における候補文字
を順次読出し7て一致検出し、その後第2位の文字をセ
レクトしてその文字位置の候補カテゴリに対する一致検
出を行うように、カウンタ25のアドレス制御と、セレ
クタ28のセレクト制御を同期させるようにすればよい
。このようにしても、先の例と同様に照合処理を行うこ
とができる。
かくして上述したような照合処理を行い、−軟度の高い
候補単語を選出することによって、極めて精度の高い認
識が可能となる。しかも、各文字に対するr個の候補カ
テコゝりに対して照合処理を行うので、高速度に簡潔に
精度の高い認識が可能である。従って極めて効果的な、
実用性の高い文字認識が可能となる等の絶大なる効果を
奏する。
ところで、前記認識部1ノが読取り対象外とする文字を
含む単語までも認識しようとする場合、一般的には次の
ような問題がある。即ち今、「鮫島」なる人名単語を認
識対象とするにも拘らず上記文字「鮫」が認識部1ノの
読取対象外である場合、上記「鮫」なる文字を正しく読
取ることができない為、結果その認識ができなくなる。
そこで、本装置では、上記「鮫」なる文字の如き読取対
象外の文字を含む11語を認識対象とするとき、その文
字について読1iV対象中の文字で、且つ上記「鮫」な
る文字に似た文字、例えば「鮮」なる文字で置換し−ご
新たな単語「鮮島」を作成する。そして、とのη’ N
/lを、第5図に示すように単語辞書14に登録する。
このとき、単語辞書14には、文字置換した単語である
旨を示すフラッグ14れを立て、−に配置換作成された
単語14bと、元の単語、つまり原単語14cどをそれ
ぞれ対応させて登録しておく。そして、第5図にその処
理概念を示すように、入力庁語を認識してなる候補単語
と、辞書単語とを照合して上記入力単語を「鮮島」とし
て認識する。
しかしてこのとき、前記フラッグ14aによって、同単
語が置換されブこものであることが示されるから、単語
辞書J4の対応関係から、上記「鮮島」に代えて「鮫島
」なる単語を候補単語としで得る。これにより入力単語
が正しく認識されることになる1゜ 尚、単語辞書14としては、例えば第6図に示すように
、原中0語14cと置換作成した単語14bとを、成る
エリアに対応表としてそ′録するものであってもよい。
かくしてこのように単語辞書14を構成することによっ
て、非常に多くの単語を認識対象とすることが可能とな
り、これらの単語をそれぞれ確実に認識することが可能
となる等の絶大なる効果が奏せられる。
尚、本発明は上記した実施例以外に種々変形して実施す
ることが可能である。例えば候補文字レジスタ21に格
納するデータをnXr個の候補カテゴリだけでなく、分
類等を示す属性データを付加したものとし、単H74辞
省内を領域分割して分類項毎にその属性に属する単語を
登録しておけば、辞書の照合範囲をしぼることができ、
認識処理の効率向上を図ることが可能となる。また単語
辞書に登録する単語にその属性を付加しておき、属性が
一致しない単語についでは認識対象から除外するように
してもよい。このようにすれば単語選択の岨シを減少さ
せることがり能となる。
要するに本発明は、その要旨を逸脱しない範囲で1・ν
々変形して実施することができる。
以上説明したように本発明によれば、候補カテゴリによ
って示される候補文字と辞書単語とをレノスタに格納し
て、高速度な照合処理を行い、その−″L(度を求める
ので、短時間に効率良く精度の高い単語認識を行い得る
。しかも、読取上1壕外り文字を含む単語についても効
果的にt3識することができる。その上、与えられた単
語の又字品質が悪い場合であっても、十分精度の高い認
識が可能であり、実用的利点が高い。
壕だ単Cγ(辞−宙の構成の単純化と、その作成変更が
容易である等の効果も奏する文字認識装置をここに杉を
供することができる。
【図面の簡単な説明】
第1図は従来装置の一例を示す概略構成図、第2図は本
発明の一実施例装置の概略構成図、第3図および第4図
はそれぞれ単語照合部の基本的な(・ti構成例示す図
、第5図は読取対象外の文字を含む単語に対する認識処
理の概念を示す図、第6図は単語辞書の別の構成例を示
す図である0 1]・・・認識部、12・・・編集部、13・・・単語
照合部、14・・・単語辞書、21・・・候補文字レソ
スタ、22・・・アドレスカウンタ、23・・・単語辞
書レジスタ、24・・・コンノやレータ、25・・・レ
ソスタカウンタ、26・・・−絞度計算部、27・・・
ソート処理部、28・・・セレクタ、14a・・・フラ
ッグ、14b・・・置換作成単語、14c・・・原単語
。 出Mji人代理人  弁理士 鈴 江 武 彦第1図 第2図 第3図 第5図 −466−

Claims (1)

    【特許請求の範囲】
  1. n文字からなる文字列として与えられた入力単語の各文
    字につき認識してそれぞれr個の候補カテゴリを求める
    文字認識部と、認識対象とする単語を登録すると共に、
    その登録単語が上記文字認識部の読取対象外文字を含む
    ときには該文字を読取対象とする文字で且つ類似した文
    字にて置換して作成された単語を前記登録単語に対応し
    て登録してなる単語辞書と、この単語辞書に登録された
    単語と前記文字認識部が求めた候補カテゴリとを単語文
    字位置毎にそれぞれ比較し、各単語文字位置において一
    致した候補カテゴリの候補順位またはその類似度から前
    記単語辞書から選ばれて比較された単語の前記入力単語
    に対する一致度を計算して一致度の高いX個の単語を候
    補単語として選択する手段と、この・1択された候補単
    語が前記読取対象外の文字を置換して作成された単語で
    あるときには前記単語辞書に対応関係を以って登録さノ
    ]ている単語を選択する手段とを具備1〜だことを特徴
    とする文字認識装置。
JP57163402A 1982-09-20 1982-09-20 文字認識装置 Pending JPS5953986A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57163402A JPS5953986A (ja) 1982-09-20 1982-09-20 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57163402A JPS5953986A (ja) 1982-09-20 1982-09-20 文字認識装置

Publications (1)

Publication Number Publication Date
JPS5953986A true JPS5953986A (ja) 1984-03-28

Family

ID=15773208

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57163402A Pending JPS5953986A (ja) 1982-09-20 1982-09-20 文字認識装置

Country Status (1)

Country Link
JP (1) JPS5953986A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59106083A (ja) * 1982-12-09 1984-06-19 Comput Basic Mach Technol Res Assoc 単語読取り装置
JPS6174087A (ja) * 1984-09-18 1986-04-16 Mitsubishi Electric Corp 単語読み取り装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59106083A (ja) * 1982-12-09 1984-06-19 Comput Basic Mach Technol Res Assoc 単語読取り装置
JPH031714B2 (ja) * 1982-12-09 1991-01-11 Denshi Keisanki Kippon Gijutsu
JPS6174087A (ja) * 1984-09-18 1986-04-16 Mitsubishi Electric Corp 単語読み取り装置

Similar Documents

Publication Publication Date Title
JP2734386B2 (ja) 文字列読み取り装置
US6978044B2 (en) Pattern string matching apparatus and pattern string matching method
JPS6120038B2 (ja)
JPS5953986A (ja) 文字認識装置
JP2000231559A (ja) 情報処理装置
JPS6262388B2 (ja)
JP2998054B2 (ja) 文字認識方法及び文字認識装置
JPH0766423B2 (ja) 文字認識装置
JP2790842B2 (ja) 文字認識後処理方式
Ganzberger et al. Matching database records to handwritten text
Murdock et al. ICFHR2016 Competition on Local Attribute Detection for Handwriting Recognition
NL9101181A (nl) Werkwijze en inrichting voor het detecteren van een of meer bekende karakterstrings in een verzameling karakters.
JPH08227427A (ja) 文字認識装置
JPS63268082A (ja) パタ−ン認識装置
JP3468199B2 (ja) 英単語認識装置
JPH06180767A (ja) 文字認識装置
JPH03154985A (ja) 最尤度単語認識方式
JPH07114622A (ja) 文字認識装置の後処理方法
JPH0474756B2 (ja)
JP2851865B2 (ja) 文字認識装置
JP3567711B2 (ja) 文字列照合装置
JPH0944604A (ja) 文字認識処理方法
JPH01191992A (ja) 文字認識装置
JPS60138689A (ja) 文字認識方法
JP2746899B2 (ja) 文字認識装置