JPS59106084A - 文字読取り装置 - Google Patents

文字読取り装置

Info

Publication number
JPS59106084A
JPS59106084A JP57216219A JP21621982A JPS59106084A JP S59106084 A JPS59106084 A JP S59106084A JP 57216219 A JP57216219 A JP 57216219A JP 21621982 A JP21621982 A JP 21621982A JP S59106084 A JPS59106084 A JP S59106084A
Authority
JP
Japan
Prior art keywords
character
string
recognition
character string
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57216219A
Other languages
English (en)
Inventor
Keiji Kobayashi
啓二 小林
Masataka Yamamoto
山本 勝敬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Computer Basic Technology Research Association Corp
Original Assignee
Computer Basic Technology Research Association Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Computer Basic Technology Research Association Corp filed Critical Computer Basic Technology Research Association Corp
Priority to JP57216219A priority Critical patent/JPS59106084A/ja
Publication of JPS59106084A publication Critical patent/JPS59106084A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 帆明の属する分野〕 本発明は、文字を認識して読み取る文字読取り装置に係
り、特に複数の文字からなる文字列について、単語辞書
を用いて読み取る文字読取り一装装置に関するものであ
る。
樅来技術の構成及び動作〕 従来この種の文字読取り装置としては、例えば光学文字
読取り装置(OCR−0ptical Cbaract
erReader )が知られている。このものは、大
略、読み取るべき文字に光源から光を照射し、この文字
からの反射光を光電変換素子により受光し、光の強弱を
電気信号に変換する光電変換部と、あらかじめ基準パタ
ーンとして用意されているパターンと入力された未知の
文字パターンを比較回路により照合し、どの基準パター
ンと最も良く類似しているかにより判定する文字判定部
と、文字を判定されていない紙を収容する部分2紙を光
電変換部まで移動させる部分1判定された紙を収容する
部分から構成されている紙送り機構部とから成っている
。そして、上記光学文字読取り装置を用いて文字列を読
み取るに際し、認識される文字列が限定される場合、こ
の限定された文字列の各文字に対応した基準パターンと
入力文字との類似度を求め、その総和が最大きなる文字
列を認識結果として求め、これを基にして文字列を読み
取っていた。
〔従来技術の欠点〕
従来の上記光学文字読取り装置は以上のように構成され
ているので、例えば限定された文字列を読み取る場合、
この限定された文字列の各文字に対応した基準パターン
と入力文字との類似度を求め、その総和が最大となる文
字列を認識結果として求め、これを基にして文字列の読
み取りを行なうものである。したがって、文字列の数が
増加すれはそれの認識に要する時間が増大するという欠
点があった。
け発明の目的〕 本発明は上記のような従来のものの欠点を除去するため
になされたもので、文字を走査して特徴を抽出する特徴
抽出手段と、認識対;数文字の基準パターンの特徴を格
納した認識辞書と、入力文字の特徴と前記基準パターン
の特徴を比較して候補文字を求める第1の認識手段と、
認識対象の文字列を格納した単語辞書と、前記認識辞書
及び単語辞書を用いて文字列を認識する第2の認識手段
とを具備し、認識の結果、類似度の高い候補文字を含む
文字列を単語辞書から選択し、この選択された文字列に
ついてのみ類似度を求めて文字列を認識するようになし
、これにより文字列の認識に賛する時間を短縮できるよ
うにした文字読取り装置以下、本発明の一実施例を図に
ついて説明する。
第1図は本発明の一実施例である文字読取り装置を示す
構成図である。第1図において、1は文字を走査して特
徴を抽出する特徴抽出手段、2は帳票、4は認識対象文
字の基準パターンの%徴を格納した認識辞書、3は入力
文字の特徴と上記基準パターンの特徴を比較して候補文
字を求める第1の認識手段、6は認識対象の文字列を格
納した単語辞書、5は上記認識辞書4及び単語辞書6を
用いて文字列を認識する第2の認識手段である。
第2図は第1図の文字読取り装置に適用される入力文字
列及び候補文字のそれぞれ一例を示す図である。ここで
は、入力文字列7の各文字例が「漢」9.[字JLO,
「認Jll、l’−識」12で示され、これらの文字に
7対する類似度の高い候補文字8の例が「、?J13.
「学J 、14 、 「認」15 、 「?」16で示
されており、「?」は類似度の高い候補文字が無い場合
を示している。
第3図は第1図の文字読取り装置における単語辞書の内
容の一例を示す図である。第3図においては、単語辞書
6内の文字列は説明を明瞭にするため、文字数を4個と
し、7種類の文字列17ないし23がある場合を示して
いる。
第4図は第2図に示す入力文字列に対する第3図に゛示
す2種類の文字列の例における、各文字ごとの類似度を
示す図である。ここでは、第2図に示す入力文字列7の
各文字「漢」9.「字」1o。
「認J 11.、 「識」12に対する第3図に示す文
字列「漢字認識」18、及び文字列「文学全集」22の
各文字ごとの類似度を示している0次に、本発明の一実
施例である文字読取り装置の動作を、上記第1図ないし
第4図を用いて説明する。まず、第1図に示す特徴抽出
手段1では帳票2上に記入された文字を走査し、かつそ
の文字の特徴を抽出する。次いで、第1の認識手段3で
は上記特徴抽出手段1で抽出された特徴量(!:認識辞
書4内のすべての認識対象文字の基準パターンの特徴量
とを比較し、候補文字を求める。第2の認識手段5では
入力文字列7に対する候補文字8のうち、特に類似度の
高い候補文字8を含む文字列を単語辞書6から選択する
0そして、この選択された文字列の各文字に対応する基
準パターンの特′微量と上記入力文字列7に対応する文
字の特徴量とを比較して類似度を求め、各文字ごとの類
似度の総和が最大の文字列を認識結果とする。すなわち
、第2図に示されるように、入力文字列7の各文字「漢
」9.「字」10.「認Jtl、「識」12のうち、各
文字に対する類似度の高い候補文字8は「学J”4tr
認」15であるから、単飴辞書6によって選択される文
字列は、第3図に示す各文字列17ないし23のうち、
文字列の第2番目に「学」あるいは第3番目に「認」を
持つ文字列である、文字列「漢字認識」18と文字列「
文学全集」22が選択される。第2の認識手段5では上
記各文字列「漢字認識」18及び「文学全集」22中の
文字について、認識辞書4中の基準パターンとの類似度
を各文字ごとに求め、その類似度の総和が最大となる文
字列を認識文字列と決定するものである。
さらに、上記した認識文字列を決定する一例について詳
述する。第2図に示される入力文字列7の文字「漢Jl
(!:第4図に示される各基準パターン「漢」23及び
1文」24との類似度は、[0,5425及びl’−0
,2J26である。また同様に、入力文字列7の文字1
字」10と各基準パターン「字」27及び「学」28と
の類似度は、[0,7J29及び「0.9J30である
。また同様に、人力文字列7の文字「認」11と各基準
パターン「認」31及び「全」32との類似度は、「0
.9」33及び「0.2J、34である。また同様に、
入力文字列7の文字「識」12.!:各基準パターン「
識」35及び「集」36との類似度は、「0.7337
及び「o、5J38である。したがって、第2図に示す
入力文字列7の各文字「漢」9.「字」10゜rl 1
1 、r識J12と第3図に示す文字列「漢字認識」1
8との類似度は、各文字ごとの類似度を加算して、o、
 5+ 0.7 + 0.9 + 0.7 = 2. 
sとなり、また文字列「文学全集」22との類似度は、
0.2 + 0.9 + 0.2 + 0.5 = 1
.8となや。この結果、類似度の最大の文字列「漢字認
識」18を認識文字列と決定するものである。
上述したように、本発明の文字読取り装置では、単語辞
書内のすべての文字列との類似度を求める上記従来例の
ものに比べて、類似度の高い候補文字8を用いて単語辞
書6内の文字列を選択し、この選択された文字列との類
似度を求めるようにしたので、文字列を高速度に認識す
ることが可能となる。
〔本発明の他の実施例〕
なお、上記実施例では文字列内の文字数力S4(固の場
合について説明したが、本発明−1これζこ限定される
ことなく、入力文字列7と単語辞書6内の文字列の各文
字数が一致したものを対象とずれ(ず、特に文字数を限
定することな〈実施できる。
また、上記実施例では文字列全体の類似度として各文字
ごとの類似度を単純に加算する場合ζこついて説明した
が、本発明はこれに限定されることなく、各文字ごとの
類似度に重み付けをしてカロ算する演算式を使用して実
施することができ、この場合にも上記実施例と同様の効
果を奏する。
[本発明の効果〕 以上のように、本発明に係る文字読取り装置によれは、
認識の結果、類似度の高G)候補文字を含む文字列を単
語辞書から選択し、この選択さ1’した文字列について
のみ類似度を求めて文字列を8忍識するようにした構成
としたので、この棟の従来例のものに比べて、文字列の
認識を極めて高速度に行なうことができるという優れた
効果を奏するものである。
【図面の簡単な説明】
第1図は本発明の一実施例である文字読取り装置を示す
構成図、第2図は第1図の文字読取り装置に適用される
入力文字列及び候補文字のそれぞれ一例を示す図、第3
図は第1図の文字読取り装置における単語辞書の内容の
一例を示す図、第4図は第2図に示す入力文字列に対す
る第3図に示す2種類の文字列の例におけ、る、各文字
ごとの類似度を示す図である。 1・・・・・・・−・特徴抽出手段、2・・・・・・・
・・帳票、3・・・・・・・・・第1の認識手段、4・
・・・・・・・・認識辞書、5・・・・−・・第2のg
職手段、6・・・・・・・・・単語辞書、7・・・・・
−・・入力文字列、8・・・・・・・・・候補文字。 なお、図中、同一符号は同一、又は相当部分を示す。 代理人   葛  野  信  − 第1図 第4図 第2図 第3図 ^

Claims (1)

    【特許請求の範囲】
  1. 用紙などに記録された文字を認識して読み取る文字読取
    り装置において、文字を走査して特徴を抽出する特徴抽
    出手段と、認識対象文字の基準パターンの特徴を格納し
    た認識辞書と、入力文字の特徴と前記基準パターンの特
    徴を比較して候補文字を求める第1の認識手段と、認識
    対象の文字列を格納した単語辞書と、前記認識辞書及び
    単語辞書を用いて文字列を認識する第2の認識手段とを
    具備し、前記第1の認識手段で求めた候補文字のうち、
    類似度の高い候補文字を含む文字列を前記単語辞書から
    選択し、かつこの選択された文字列に限り、1文字ごと
    の類似度から文字列全体の類似度を求めて文字列を認識
    することを特徴とする文字読取り装置。
JP57216219A 1982-12-09 1982-12-09 文字読取り装置 Pending JPS59106084A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57216219A JPS59106084A (ja) 1982-12-09 1982-12-09 文字読取り装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57216219A JPS59106084A (ja) 1982-12-09 1982-12-09 文字読取り装置

Publications (1)

Publication Number Publication Date
JPS59106084A true JPS59106084A (ja) 1984-06-19

Family

ID=16685139

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57216219A Pending JPS59106084A (ja) 1982-12-09 1982-12-09 文字読取り装置

Country Status (1)

Country Link
JP (1) JPS59106084A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6174087A (ja) * 1984-09-18 1986-04-16 Mitsubishi Electric Corp 単語読み取り装置
US4677599A (en) * 1984-06-20 1987-06-30 Nissan Motor Company, Limited Ultra-sonic distance measuring apparatus and method
US4739860A (en) * 1984-05-29 1988-04-26 Nissan Motor Co., Ltd. Ultrasonic rangefinder

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4739860A (en) * 1984-05-29 1988-04-26 Nissan Motor Co., Ltd. Ultrasonic rangefinder
US4796726A (en) * 1984-05-29 1989-01-10 Nissan Motor Co., Ltd. Ultrasonic rangefinder
US4677599A (en) * 1984-06-20 1987-06-30 Nissan Motor Company, Limited Ultra-sonic distance measuring apparatus and method
JPS6174087A (ja) * 1984-09-18 1986-04-16 Mitsubishi Electric Corp 単語読み取り装置

Similar Documents

Publication Publication Date Title
JPH0682403B2 (ja) 光学式文字読取装置
JPS59106084A (ja) 文字読取り装置
JPS6226587A (ja) 光学文字読取装置の文字フイ−ルドフリ−ピツチ処理方式
JP2985243B2 (ja) 文字認識方法
JP2538543B2 (ja) 文字情報認識装置
JPS5739478A (en) Recognition system
JPS59158482A (ja) 文字認識装置
JPS6125284A (ja) パターン認識装置
JP2003115028A (ja) 帳票識別辞書自動生成方法及び帳票処理システム
JPH0319589B2 (ja)
JPH0475556B2 (ja)
JP2813600B2 (ja) 表形式文書読取装置
JPS6249581A (ja) 文字認識装置
JPS62169289A (ja) 光学文字読取装置
JPS60138689A (ja) 文字認識方法
JPS59177683A (ja) 光学的文字読取装置
JPH0272497A (ja) 光学的文字読取装置
JPS63178379A (ja) 光学式文字読取装置
JPS57121755A (en) Aerial photography processing system
JPS60144886A (ja) 文字認識装置における後処理方式
JPS5933579A (ja) 文字認識方式
JPS60134992A (ja) 文字入力装置
JPS5914078A (ja) 帳票読取装置
JPS61196385A (ja) 光学文字読取装置
JPS59128681A (ja) 文字読取り装置