JPS6143383A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPS6143383A
JPS6143383A JP16589984A JP16589984A JPS6143383A JP S6143383 A JPS6143383 A JP S6143383A JP 16589984 A JP16589984 A JP 16589984A JP 16589984 A JP16589984 A JP 16589984A JP S6143383 A JPS6143383 A JP S6143383A
Authority
JP
Japan
Prior art keywords
characters
character
stored
item
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP16589984A
Other languages
English (en)
Inventor
Seiichiro Yamaguchi
誠一郎 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP16589984A priority Critical patent/JPS6143383A/ja
Publication of JPS6143383A publication Critical patent/JPS6143383A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、帳票等に記された漢字文字を読み取って認識
する文字認識装置(以下OCRという)に係り、特に限
られた範囲の住所9氏名等に使用される文字を高速に認
識することができる文字認識装置に関するものである。
近来、OCRの進歩は目覚ましく、英数字、がな文字を
対象とする活字印刷、及び手書き文字の読み取りが可能
なOCRが、帳票処理業務等に広く実用に供されている
が、更に漢字を含む日本語文字の認識技術の開発も盛ん
で種々の方法が試みられている。
漢字を対象としたOCRは一般に文字認識に時間が掛か
るが、例えば金融機関等において帳票等に凹かれノζ顧
客住所1氏名を読み取る場合には、高速処理できる方法
が望まれている。
(従来の技術〕 第3図し:L漢字を含む日本語文字のOCRのブロツク
図を示し、図において、帳票1は、フィールド毎に顧客
の住所2氏名、または品名等の項目が記された伝票であ
る。
読取部2は、帳票1上に照射された光の反射光をレンズ
系21を経てイメージセンサ22によって走査して1フ
レームの文字を読み取り、イメージデータとして2値化
回路3へ送る機能を有する。
主制御部4は、各部を制御して文字読取り、認識処理プ
ログラムを遂行する機能を有する。
画像メモリ5ば、2値化されたイメージデータ。
即ち、読み取られた文字の画像データを記憶するもので
ある。
1文字切出口路6は、フォーマット情報メモリ9から送
られるフォーマット情報に基いて、画像メモリ5に記憶
された1フレームの文字より1文字を切り出して認識回
路10へ送る機能を有する。
特徴抽出回路7は、認識回路10から送られる文字の特
徴、即ち、文字の画数5曲線係数等を抽出して認識回路
10へ送る機能を有する。
辞四メモリ8は、認識の基準となる文字の特徴が記憶さ
れており、認識回路10の要求により、順次認識回路1
0へ送出する機能を有する。
フォーマット情報メモリ9は、帳票1上の文字記入位置
を示す情報が格納されており、読み取られた文字の記入
位置を画像メモリ5.1文字切出口路6.及び認識回路
10へ送る機能を有する。
認識回路IOは、1文字切出口路6より送られた文字に
対する特徴を特徴抽出回路7より受は取り、辞書メモリ
8から順次送られる文字の特徴とを照合して一致度を求
め、−成度の高いものから順に文字コードを候補列とし
て送出する機能ををする。
後処理部11は、候補列の文字コードの一致度を所定(
例えば70%)値でスレッシュホールドして篩に掛け、
項目を付けて送出する機能を有する。
このような構成及び機能を存するので、文字認識の方法
を説明すると、まず帳票1上の文字が読み取られて2値
化された画像データは画像メモリ5に格納される。
次に画像データは1文字切出回路6に送られ、フォーマ
ット情報メモリ9から送られた文字位置情報に基いて、
1文字の切出しを行って認識回路10へ送る。
認識回路10ば入力した文字データを特徴抽出回路7へ
送り、その文字データの特徴を抽出させて受は取る。そ
こで辞書メモリ8より文字の特徴を順次読み出して文字
データの特徴と照合して、−成度の高い文字を認識の答
として候補文字にする。
この候補文字が複数個あれば候補列として順次文字コー
ドを出力する。
出力された文字コードの候補列は、後処理部11で篩に
掛けられ、項目が付けられて出力し、例えばフロッピー
ディスク等の記憶手段に記tαされる。
項目を付ける目的は、例えば漢字/かな/数字等を別々
に認識して、後で組合せて元に戻すようにする為である
このようにして画像メモリ5に格納されている画像デー
タは順次文字認識が行われる、上記の候補文字への項目
の指定は後処理の時に行わないで、項目別の辞書メモリ
を持つ方法も行われている。
〔発明が解決しようとする問題点〕
上記従来方法によると、項目を指定する方法として、 ■認識終了後の後処理時に付ける方法、■項目別に辞書
メモリを持つ方法、 があるが、■の方法では認識対象文字が多く、処理時間
が長く掛かり、また■の方法では、辞四メモリの容■が
膨大になるという問題点がある。
〔問題点を解決するための手段〕
本発明は、辞書メモリに、該辞書メモリに記憶されてい
る文字の属する項目が記憶される記憶領域を設けると共
に、記憶領域に記憶された文字の属する項目と読み取ら
れた文字の属する項目とを比較する比較手段を備え、比
較手段による°比較の結果、辞書メモリ中の該当する項
目を有しない文字は認識の対象としない文字認識装置で
あり、かくすることにより上記問題点を解決することが
できる。
ここで文字の属する項目とは、住所1氏名、または品名
等、その文字が使用される範囲を指定したものである。
〔作用〕
本発明によれば、従来の、文字の属する項目を認識終了
後の後処理時に付ける方法、或いは項目別に辞書メモリ
を持つ方法に代えて、記憶されている文字の属する少な
くとも1個の項目が記憶される記憶領域を辞書メモリに
設け、この記憶領域に記憶されている項目と、読み取っ
た文字パターンの項目とを比較手段によって比較して、
辞書メモリ中に該当する項目を有しない文字は認識の対
象としないことにより、認識対象文字を限定することが
できるので、認識時間を短縮して効率の良い認識処理を
行うことができ、また辞書メモリの容量を膨大に準備す
る必要もない。
〔実施例〕  ′ 以下、本発明の一実施例を第1図及び第2図を参照して
説明する。第1図は本発明による実施例の要部を示すブ
ロック図、第2図は第1図のフローチャートである。企
図を通じて同一符号は同一対象物を示す。
第1図において、1点鎖線で示す辞書メモリ8aは、各
記tα文字が属する項目が記憶される記憶領域811文
字が記憶された文字領域821文字の特徴が記憶された
特徴領域83を備えている。即ち、記憶領域81には、
記憶文字の属する項目1例えば住所1氏名、または品名
等の項目が記憶される。
また1点鎖線で示す認識回路10aは、読み取られた文
字の項目、及び特徴が格納される特徴バッファ12.特
徴を照合する演算回路135項目を比較する比較回路1
4.候補文字を一時記憶し、−政変の高い順に送出する
候補文字記憶回路15.及びこれらを制御する制御回路
16で構成されている。
即ら、第2図の従来例における辞書メモリ8゜及び認識
回路10が、辞書メモリ8a、及び認識回路10aに置
き変っている。従って特徴抽出回路7によって文字デー
タから抽出した特徴が送出されるまでは従来例と同様で
ある。
このような構成及び機能を有するので、第2図のフロー
チャー1・により認識方法を説明する。
■特徴抽出回路7より認識回路10aに送られた文字デ
ータの特徴は、項目と共に特徴バッファ12に格納され
る。
■次に特徴バッファ12より文字データの項目が、辞書
メモリ8aより記憶文字の項目が、夫々比較回路14に
送られて比較される。
■項目が一致した場合には、特徴バッファ12より文字
データから抽出した特徴が、辞書メモリ8aより記憶文
字の特徴が、夫々演算回路13に送られて照合され、−
政変が求められる。
■−一致度高いものは候補文字として文字コードが候補
文字記憶回路15に送られる。−政変の高い候補文字が
出揃った時に、候補文字記憶回路15より一致度の高い
順に候補列として送り出され、図示していない後処理部
11へ送られる。
■比較回路14における比較で項目が一致しない場合に
は、文字データから抽出した特徴と辞書メモリ8aのそ
の記憶文字の特徴との照合を行わず、次の記憶文字の項
目との比較を行う。
このようにして項目の一致した記憶文字とだけ照合を行
うことにより、迅速に認識処理を行うことができ、また
辞書メモリ容量を膨大に準備する必要もない。
(発明の効果〕 以上説明したように本発明によれば、読み取られる文字
の項目と、辞書メモリに記憶されている文字の項目とを
比較して一致しない記憶文字との照合を行わないので、
認識処理の時間を著しく短縮することができ、また項目
別辞書メモリを使用する方法のように辞書メモリの容量
を膨大に準備する必要もないという効果がある。
【図面の簡単な説明】
第1図は本発明による実施例の要部を示すブロック図、
第2図は第1図のフローチャート、第3図は従来方法を
示すブロック図である。 。 図において、4は主制御部、5は画像メモリ、6は1文
字切出回路、7は特徴抽出回路、8.8aは辞書メ士り
、9はフォーマット情報メモリ、lo。 10aは認識回路、1°1は後処理部を示す。 算 3 図 寥 2 ■

Claims (1)

    【特許請求の範囲】
  1. 媒体上に記された文字に光を照射し、該照射した光の反
    射光より得られた前記文字の画像データを2値画像とし
    て記憶する画像メモリと、該画像メモリに記憶される文
    字の画像データを認識する認識部と、該認識の基準とな
    る文字の特徴が記憶される辞書メモリとを備え、前記画
    像メモリから読み出した文字の特徴と、前記辞書メモリ
    から読み出した基準となる文字の特徴とを、前記認識部
    で照合して認識する文字認識装置であって、前記辞書メ
    モリに、該辞書メモリに記憶されている文字の属する項
    目が記憶される記憶領域を設けると共に、該記憶領域に
    記憶された前記文字の属する項目と前記読み取られた文
    字の属する項目とを比較する比較手段を備え、前記比較
    手段による比較の結果、前記辞書メモリ中の該当する項
    目を有しない文字は認識の対象としないことを特徴とす
    る文字認識装置。
JP16589984A 1984-08-08 1984-08-08 文字認識装置 Pending JPS6143383A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP16589984A JPS6143383A (ja) 1984-08-08 1984-08-08 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP16589984A JPS6143383A (ja) 1984-08-08 1984-08-08 文字認識装置

Publications (1)

Publication Number Publication Date
JPS6143383A true JPS6143383A (ja) 1986-03-01

Family

ID=15821097

Family Applications (1)

Application Number Title Priority Date Filing Date
JP16589984A Pending JPS6143383A (ja) 1984-08-08 1984-08-08 文字認識装置

Country Status (1)

Country Link
JP (1) JPS6143383A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04123185A (ja) * 1990-09-14 1992-04-23 Hitachi Ltd 文書認識方式

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59148983A (ja) * 1983-02-14 1984-08-25 Hitachi Ltd 漢字認識辞書選択方式

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59148983A (ja) * 1983-02-14 1984-08-25 Hitachi Ltd 漢字認識辞書選択方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04123185A (ja) * 1990-09-14 1992-04-23 Hitachi Ltd 文書認識方式

Similar Documents

Publication Publication Date Title
US6038351A (en) Apparatus and method for multi-entity, mixed document environment document identification and processing
JPH0520500A (ja) 文書認識装置
JPH0682403B2 (ja) 光学式文字読取装置
JPS6143383A (ja) 文字認識装置
JPS6146573A (ja) 文字認識装置
JPH051512B2 (ja)
JPS6336389A (ja) 文字読取装置
JP3121401B2 (ja) 認識辞書及び文字認識装置
JP2746345B2 (ja) 文字認識の後処理方法
JPH0514953B2 (ja)
JP3720405B2 (ja) 領域識別装置及び方法
JPS62177686A (ja) 光学的文字読取装置
JPS60138689A (ja) 文字認識方法
JP2982244B2 (ja) 文字認識後処理方式
JP2784004B2 (ja) 文字認識装置
JPH09179935A (ja) 文字認識装置およびその制御方法
JPH0589279A (ja) 文字認識装置
JPS6327992A (ja) 個人用辞書作成方法
JPS5999586A (ja) 光学的文字読取装置
JPH041882A (ja) 文字認識方法およびその装置
JPH0272497A (ja) 光学的文字読取装置
JPH03212783A (ja) マッチング方式
JPH06180793A (ja) ナンバープレート自動認識装置
JPH07111729B2 (ja) 読取装置
JPH01259476A (ja) 文字読取装置