JPS6191780A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPS6191780A
JPS6191780A JP59213950A JP21395084A JPS6191780A JP S6191780 A JPS6191780 A JP S6191780A JP 59213950 A JP59213950 A JP 59213950A JP 21395084 A JP21395084 A JP 21395084A JP S6191780 A JPS6191780 A JP S6191780A
Authority
JP
Japan
Prior art keywords
dictionary
work area
contents
matching
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59213950A
Other languages
English (en)
Inventor
Minoru Nagao
永尾 実
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Tateisi Electronics Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Tateisi Electronics Co filed Critical Omron Tateisi Electronics Co
Priority to JP59213950A priority Critical patent/JPS6191780A/ja
Publication of JPS6191780A publication Critical patent/JPS6191780A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〈発明の技術分野〉 この発明は、用紙上に記録された仮名、英字、数字、記
号等の文字(以下これを「未知文字」という)を読み取
り、この読取り画像を予め辞書中に用意しである標準パ
ターンと照合し、その−政変に基づき未知文字を特定す
る文字認識装置に関する。
〈発明の背景〉 第5図は文字認識装置の概略構成例を示す。
図示例の装置は、用紙21上に記録された未知文字22
を読取りヘッド23で光学的に読み取り、これを〜の変
換器24で電気信号に変換処理して読取り画像を得るも
のである。この読取り画像は前処理回路25でノイズ除
去、平滑化、大きさの正規化等、いわゆる前処理か施こ
された後、画像メモリ26へ一旦格納される。尚この前
処理は、つぎの特徴抽出処理を高精度かつ容易に実行す
るために行なうものである。
つぎの特徴抽出回路27は画像メモリ26に格納された
画像より、未知文字の特徴(例えばループ、端点、分岐
点、連結数等)を抽出するもので、これら文字特徴を規
定するデータはつぎの辞書照合回路28にて標準パター
ンと照合される。この標孕パターンは予め辞書29中に
格納されており、前記の辞書照合回路28は照合−政変
に基づき未知文字を特定化してその結果を出力する。
ところで前記の辞書29は、認識対象文字の数が多い程
、予め用意する標準パターン数が増し、辞書照合処理に
多大の時間を費やすことになる。このため従来は、辞書
29をいくつかのグループに分類し、分類された各グル
ープ毎に照合処理を実行するようになっている。
第6図はグループ化の一例を示すもので、例えばまずル
ープの有無、連結数等で大分類し、つぎにループ数、端
点数、分岐点数等で中分類し、更に端点位置、ストロー
ク状態、凹み状態等で小分類し、更に必要に応じて詳細
分類を行なっている。従って辞書照合動作では、まず未
知文字特徴のうち、大分類に必要な文字特徴と各大分類
グループとを照合して大分類グループを決定し、つぎに
中分類に必要な文字特徴と先に決定された大分類グルー
プにつながる各中分類グループとを照合して中分類グル
ープを決定し、更に同様の照合処理にて小分類グループ
を決定する。この小分類グループは単数才たは複数の候
補文字を含むが、これが複数の場合には、更に詳細な分
類グループが決定される。
なお上記分類グループの決定処理において、各段階の分
類に必要な文字特徴かいずれの分類グループとも一致し
ない場合は、その時点で認識不能としてリジェクト出力
される。
また、上述における標準パターンとは、認識対象文字の
サブカテゴリを含むものであり、例えば第7図に示す認
識対象文字「5」の場合、3個のサブカテゴリより成る
標準パターンをもつ0 かくして決定された分類グループについて各標準パター
ンとの照合が実施されるが、この場合、辞書照合処理速
度はそのグループに含まれる標準パターンの数、更には
標準パターンの配列方法等に影響される。通常標準パタ
ーンはランダム配列されており、辞書照合は標準パター
ンの配列順序に従って進行される。このため頻繁に照合
対象となるような標準パターンがその照合順位が低い場
合には、その分辞書照合処理時間が長(かかり、認識速
度の低下を招くことになる。
〈発明の目的〉 本発明は、辞書における標準パターンの配列方法を工夫
することによって、辞書照合処理時間を短縮し、認識速
度を向上させた文字認識装置を提供することを目的とす
る。
〈発明の構成および効果〉 上記目的を達成するため、本発明では、未知文字の読取
り画像より文字特徴を抽出し、この文字特徴を辞書手段
に予め格納しである標準パターンと照合して未知文字を
特定する装置において、前記辞書手段は、辞書照合の都
度、照合一致にかかる標準パターンの格納位置を、辞書
照合順位の高い位置へ更新設定するようにした。
本発明によれば、頻繁に辞書照合される標準パターンに
ついてはその照合順位の高い位置に配置されて優先的に
照合処理が実施されることになるから、無駄な辞書照合
処理が省かれてその分処理時間が短縮され、認識速度が
高速化される等、発明目的を達成した顕著な効果を奏す
る。
〈実施例の説明〉 第1図は本発明にかかる辞書の構成例を示す。
第1図中、左側の図は、未知文字「ン」との照合処理前
の辞書内容を、また右側の図は、照合一致処理後の辞書
内容を夫々示している。図示例は、RAM(Rando
m  Access  Memory )で構成された
中分類グループの辞書を示しており、アドレスm −?
−m +nの各領域には同図に示すような複数の標準パ
ターンが格納されている。画像メモリ26中の未知文字
とこれら標準パターンとの辞書照合処理は、標準パター
ンの配列順序に従って実行され、照合処理の結果、パタ
ーンの一致があったとき、照合にかかるその標準パター
ンは照合順位が最上位のアドレ、ス領域に更新位置せら
れる。各標準パターンは、第2図に示す如く、文字特徴
を規定する8ビツトコードより構成され、0〜7の各ビ
ットのうち、例えばビット7はループ数か2のときに「
1」、ビット6は連結数か2のときに「1」となるよう
意味つけが行なわれている。尚第2図中、領域aは上記
8ビツトコードを格納する領域、その下の領域すは下位
の分類グループ(大分類の場合は中分類、中分類の場合
は小分類)のグループ番号と、標準パターンのIDコー
ドが格納される領域である。
第3図は、辞書照合処理および辞書更新動作を示すフロ
ーチャートを示し、ステップ1で辞書照合カウンタFO
NTC(第1図に示す)がゼロにクリアされる。この辞
書照合開始時点では、同じ第1図に示す辞書アドレスポ
インタFONTは分類グループの先頭アドレスmを指示
しており、つぎのステップ2でこのポインタFONTが
指示するアドレスmの標準パターン(この場合の標準パ
ターンは「ン」である)をワークエリアXにロードする
。つぎにステップ3で辞書照合カウンタP ON T 
Cを1加算し、更につぎのステップ4においてポインタ
PONTの内容にカウンタPONTCの内容を加算した
値に対応するアドレス、すなわちつぎのアドレスm+1
の標準パターン(この場合の標準パターンは「5」であ
る)を他のワークエリアYにロードする。
そしてつぎのステップ5において、入力された未知文字
(この場合の未知文字は「ソ」である)の特徴が前記ワ
ークエリアXに格納済の標準パターンと比較される。こ
の場合両者は不一致であるから、ステップ5がNO″ 
となってステップ6へ移行し、ポインタFONTの内容
に ゛カウンタPONTCの内容を加算した値に対応す
るアドレス領域、すなわちアドレスm+1の領域に前記
ワークエリアXの内容「ン」を格納し、更につぎのステ
ップ7でワークエリアYの内容「5」をワークエリアX
へ移す。
つぎのステップ8は分類グループの全標準パターンにつ
き辞書照合を実施したか否かを判定しており、この場合
、その判定は“NO4であるから、ステップ3へ戻り、
カウンタPONTCの内容に1加算し、つぎのステップ
4でつぎのアドレスm+2の領域の標準パターン(この
場合の標準パターンは「・7」である)をワークエリア
Yヘロードした後、ステップ5のパターン比較が実施さ
れる。本実施例の場合、ステップ5の判定はNO“ で
あり、前記のステップ6〜8を経て再度ステップ3へ戻
り、今度はステップ5で未知文字「・7」とワークエリ
アXの内容「ソ」とが比較されることになる。この場合
はステップ5の判定は′/YES//となってステップ
9へ進み、ポインタFONTが指示する領域、すなわち
先頭アドレスmの領域にワークエリアXの内容が格納さ
れる。かくして第5図の左側に示すメモリマツプが右側
に示すメモリマツプに更新設定されることになり、つぎ
の辞書照合動作は標準パターン「ゾ」が1番に実施され
ることになる。
尚最終の標準パターンに至るまで照合一致の判定がなさ
れなかったときは、ステップ8が1lYESll とな
り、ポインタFONTが指示する先格納し、ポインタF
ONTを歩進させて(従ってつぎの辞書照合はアドレス
m十iより開始される。)処理を完了する(ステップ1
0,11)。
こ9場合は認識不能としてリジェクト処理されることに
なり、この場合は第4図に示す如く、最終の辞書照合に
かかる標準パターンrA Jがアドレスmの領域に格納
される。
【図面の簡単な説明】
第1図は辞書照合が一致した場合における辞書中の標準
パターンの配列更新例を示す図、第2図は標準パターン
のデータ構成例を説明するための図、第3図は辞書照合
処理動作を示すフローチャート、第4図は照合不一致時
における辞書中の標準パターンの配列を示す図、第5図
は文字認識装置の回路構成例を示すブロック図、第6図
は辞書の分類グループ化を説明するため(7)図、第7
図は標準パターンのサブカテゴリを説明するための図で
ある。 23・・・読取りヘッド   26・・・画像メモリつ
り 10.水鯵Phhb中斤4q欠      9只 
0.・田之婁昭イト同♀名四・・・辞 書 特許出願人  立石電機株式会社 す3回 スタート PρNγC8θ ルホr 7もXへ FONTC3 〃0        6 9               シ ナ4日 ・、2 )コ せJ 預4 禅67 す ))a 卦’7TEZI

Claims (1)

  1. 【特許請求の範囲】 未知文字を読み取る読取り手段と、読取り画像を格納す
    る画像格納手段と、読取り画像より文字特徴を抽出する
    特徴抽出手段と、認識対象文字の標準パターンを格納し
    ておく辞書手段と、前記未知文字の文字特徴を辞書手段
    の標準パターンと照合して未知文字を特定する辞書照合
    手段とを具備し、 前記辞書手段は、辞書照合の都度、照合一致にかかる標
    準パターンの格納位置を、照合順位の高い位置へ更新設
    定可能とした文字認識装置。
JP59213950A 1984-10-11 1984-10-11 文字認識装置 Pending JPS6191780A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59213950A JPS6191780A (ja) 1984-10-11 1984-10-11 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59213950A JPS6191780A (ja) 1984-10-11 1984-10-11 文字認識装置

Publications (1)

Publication Number Publication Date
JPS6191780A true JPS6191780A (ja) 1986-05-09

Family

ID=16647730

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59213950A Pending JPS6191780A (ja) 1984-10-11 1984-10-11 文字認識装置

Country Status (1)

Country Link
JP (1) JPS6191780A (ja)

Similar Documents

Publication Publication Date Title
JP2726568B2 (ja) 文字認識方法及び装置
JPH06187497A (ja) 文字認識方法
US4799271A (en) Optical character reader apparatus
JP2847715B2 (ja) 文字認識装置及び文字認識方法
JP2720590B2 (ja) パターン認識装置
JPH0729003A (ja) 指紋照合装置
JPS6191780A (ja) 文字認識装置
US5226174A (en) Character recognition system for determining a class of similarity based on computer distance with a smallest value indicating close similarity
EP0370766B1 (en) Sorting method and apparatus
JP2839515B2 (ja) 文字読取システム
JP2746345B2 (ja) 文字認識の後処理方法
JP3266441B2 (ja) 文字認識方法
JPS59117673A (ja) 文字認識装置における後処理方式
JPH0580710B2 (ja)
JPS61148585A (ja) 文字認識装置
JPH03228195A (ja) 光学的文字認識装置
JPH10269311A (ja) 帳票処理単位指定方法
JPS6266326A (ja) 日本語デ−タ整列処理方式
JPH0896080A (ja) 光学文字読取装置
JP2743995B2 (ja) 文字読取装置
JP2784004B2 (ja) 文字認識装置
JPH0682402B2 (ja) 文字認識装置
JPH10174935A (ja) 宛名読取装置および文字情報読取装置
JPS5960685A (ja) 光学的文字読取装置
JPS5999586A (ja) 光学的文字読取装置