JPS6142083A - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JPS6142083A JPS6142083A JP16364384A JP16364384A JPS6142083A JP S6142083 A JPS6142083 A JP S6142083A JP 16364384 A JP16364384 A JP 16364384A JP 16364384 A JP16364384 A JP 16364384A JP S6142083 A JPS6142083 A JP S6142083A
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- character
- pattern
- image data
- characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、帳票等に記された漢字を含む手書き文字を読
み取って認識する文字認識装置(以下OCRという)に
係り、特に誤認識を減少させることができる文字認識装
置に関するものである。
み取って認識する文字認識装置(以下OCRという)に
係り、特に誤認識を減少させることができる文字認識装
置に関するものである。
近来、OCRの進歩は目覚ましく、英数字、かな文字を
対象とする活字印刷、及び手書き文字の読み取りが可能
なOCRが、帳票処理業務等に広く実用に供されている
が、更に漢字を含む日本語文字の認識技術の開発も盛ん
で種々の方法が試みられている。
対象とする活字印刷、及び手書き文字の読み取りが可能
なOCRが、帳票処理業務等に広く実用に供されている
が、更に漢字を含む日本語文字の認識技術の開発も盛ん
で種々の方法が試みられている。
特に漢字を含む手書き文字の認識においては誤認識を減
少させる方法が望まれている。
少させる方法が望まれている。
第3図は漢字を含む手書き文字を対象とする日本語文字
のOCRのブロック図を示す。
のOCRのブロック図を示す。
図において、帳票1は、フィールド毎に顧客の住所1氏
名、または品名等が記された伝票である。
名、または品名等が記された伝票である。
読取部2は、帳票1上に照射された光の反射光をレンズ
系21を経てイメージセンサ22によって走査して1フ
レームの文字を読み取り、イメージデータとして2値化
口路3へ送る機能を存する。
系21を経てイメージセンサ22によって走査して1フ
レームの文字を読み取り、イメージデータとして2値化
口路3へ送る機能を存する。
主制御部4は、各部を制御して文字読取り、認識処理プ
ログラムを遂行する機能を有する。
ログラムを遂行する機能を有する。
画像メモリ5は、2値化されたイメージデータ。
即ち、読み取られた文字の画像データを記憶するもので
ある。
ある。
1文字切出回路6は、フォーマット情報メモリ9から送
られるフォーマット情報に基いて、画像メモリ5に記憶
された1フレームの文字より1文字を切り出して認識回
路10へ送る機能を有する。
られるフォーマット情報に基いて、画像メモリ5に記憶
された1フレームの文字より1文字を切り出して認識回
路10へ送る機能を有する。
特徴抽出回路7は、認識回路1oから送られる文字の特
徴、即ち、文字の画数2曲線係数等を抽出して認識回路
IOへ送る機能を有する。
徴、即ち、文字の画数2曲線係数等を抽出して認識回路
IOへ送る機能を有する。
辞書メモリ8は、認識の基準となる文字の特徴が記憶さ
れており、認識回路lOの要求により、順次認識回路l
Oへ送出する機能を有する。
れており、認識回路lOの要求により、順次認識回路l
Oへ送出する機能を有する。
フォーマント情報メモリ9は、帳票1上の文字記入位置
を示す情報が格納されており、読み取られた文字の記入
位置を画像メモリ5.1文字切出回路6.及び認識回路
10へ送る機能を有する。
を示す情報が格納されており、読み取られた文字の記入
位置を画像メモリ5.1文字切出回路6.及び認識回路
10へ送る機能を有する。
認識回路10は、1文字切出口路6より送られた文字に
対する特徴を特徴抽出回路7より受は取り、辞書メモリ
8から順次送られる文字の特徴とを照合して一致度を求
め、−成度の高いものから順に文字コードを候補列とし
て送出する機能を有する。
対する特徴を特徴抽出回路7より受は取り、辞書メモリ
8から順次送られる文字の特徴とを照合して一致度を求
め、−成度の高いものから順に文字コードを候補列とし
て送出する機能を有する。
このような構成及び機能を有するので、文字認識の方法
を説明すると、まず帳票l上の文字が読み取られて2値
化された画像データは画像メモリ5に格納される。
を説明すると、まず帳票l上の文字が読み取られて2値
化された画像データは画像メモリ5に格納される。
次に画像データは1文字切出図路6に送られ、フォーマ
ット情報メモリ9から送られた文字位置情報に基いて、
1文字の切出しを行って認識回路10へ送る。
ット情報メモリ9から送られた文字位置情報に基いて、
1文字の切出しを行って認識回路10へ送る。
認識回路10は入力した文字データを特徴抽出回路7へ
送り、その文字データの特徴を抽出させて受は取る。そ
こで辞書メモリ8より文字の特徴を順次読み出して文字
データの特徴と照合して、−成度の高い文字を認識の答
として候補文字にする。
送り、その文字データの特徴を抽出させて受は取る。そ
こで辞書メモリ8より文字の特徴を順次読み出して文字
データの特徴と照合して、−成度の高い文字を認識の答
として候補文字にする。
この候補文字が複数個あれば候補列として順次文字コー
ドを出力する。
ドを出力する。
このようにして画像メモリ5に格納されている画像デー
タは順次文字認識が行われる。
タは順次文字認識が行われる。
上記従来方法によると、漢字を含む手書き文字は、漢字
の画数、平仮名の曲線係数等によって認識されるが、手
書きのくせ等によって類似文字に対する誤認識が多いと
いうという問題点がある。
の画数、平仮名の曲線係数等によって認識されるが、手
書きのくせ等によって類似文字に対する誤認識が多いと
いうという問題点がある。
本発明は、画像データの文字の特徴に暴いて認識する第
1の認識手段と、画像データの文字パターンに基いて認
識する第2の認識手段とを備え、第1の認識手段による
認識の結果1.認識の一致度が所望値より低い時は、該
当する画像データを第2の認識手段によって認識する文
字認識装置であり、かくすることにより上記問題点を解
決することができる。
1の認識手段と、画像データの文字パターンに基いて認
識する第2の認識手段とを備え、第1の認識手段による
認識の結果1.認識の一致度が所望値より低い時は、該
当する画像データを第2の認識手段によって認識する文
字認識装置であり、かくすることにより上記問題点を解
決することができる。
本発明によれば、画像データの特徴に基いて認識するだ
けの従来方法に代えて、従来方法と同様な第16認識手
段と、第1の認識手段によって認識した結果、−成度が
低い時に、更に画像データを記入者パターンメモリに記
憶された記入者パターンと照合して認識するか、或いは
画像データを所定の大きさに正規化して、この正規化さ
れた文字パターンと標準パターンメモリに記憶された標
準パターンとを照合して認識する等の第2の認識手段と
によって認識することにより、類似文字に対する誤認識
を減少させることができる。
けの従来方法に代えて、従来方法と同様な第16認識手
段と、第1の認識手段によって認識した結果、−成度が
低い時に、更に画像データを記入者パターンメモリに記
憶された記入者パターンと照合して認識するか、或いは
画像データを所定の大きさに正規化して、この正規化さ
れた文字パターンと標準パターンメモリに記憶された標
準パターンとを照合して認識する等の第2の認識手段と
によって認識することにより、類似文字に対する誤認識
を減少させることができる。
また記入者パターンメモリを認識の都度更新するので、
認識処理効率を高めることができる。
認識処理効率を高めることができる。
以下、本発明の一実施例を第1図及び第2図を参除して
説明する。第1図は本発明による実施例を示すブロック
図、第2図は第1図のフローチャーbである。全図を通
じて同一符号は同一対象物を示す。
説明する。第1図は本発明による実施例を示すブロック
図、第2図は第1図のフローチャーbである。全図を通
じて同一符号は同一対象物を示す。
第1図において、主制御部4aは、従来例で説明した主
制御部4と同様の機能、即ち、読み取られた文字の画像
データの特徴に基いて認識処理を遂行する第1の認識手
段を制御する機能を有すると共に、画像データの文字パ
ターンに基いて認識処理を遂行する第2の認識手段を制
御する機能を存する。
制御部4と同様の機能、即ち、読み取られた文字の画像
データの特徴に基いて認識処理を遂行する第1の認識手
段を制御する機能を有すると共に、画像データの文字パ
ターンに基いて認識処理を遂行する第2の認識手段を制
御する機能を存する。
判定回路1)は、画像データより抽出された特徴を辞書
メモリ8の文字の特徴と照合して認識した結果、所定の
一致度に達しているか否かを判定し、−成度が低い時は
認識回路10aに通知する。この場合には画像データの
パターンによって照合する第2の認識手段に移行する。
メモリ8の文字の特徴と照合して認識した結果、所定の
一致度に達しているか否かを判定し、−成度が低い時は
認識回路10aに通知する。この場合には画像データの
パターンによって照合する第2の認識手段に移行する。
正規化回路12は、画像メモリ5より送られる文字パタ
ーンをnXm(例えば48 X 4Bドツト)に正規化
する機能を存する。
ーンをnXm(例えば48 X 4Bドツト)に正規化
する機能を存する。
正規化文字パターンメモリ13は、正規化回路14で正
規化された文字パターンを記憶する記憶手段である。
規化された文字パターンを記憶する記憶手段である。
記入者パターンメモリ14は、既に認識の対象となった
一致度の高い文字パターン、即ち、記入者パターンを認
識の都度更新して記憶する記憶手段である。
一致度の高い文字パターン、即ち、記入者パターンを認
識の都度更新して記憶する記憶手段である。
標準パターンメモリ15は、文字の標準パターンを記憶
する記憶手段である。
する記憶手段である。
変形パターン生成回路16は、正規化された文字パター
ンの一致度の低い部分を検出して、その部分のパターン
を上下、または左右方向に移動させて、−成度を高める
ための変形パターンを生成する機能を有する。
ンの一致度の低い部分を検出して、その部分のパターン
を上下、または左右方向に移動させて、−成度を高める
ための変形パターンを生成する機能を有する。
変形パターンメモリ17は、変形パターン生成回路18
で生成された変形パターンを記憶する記憶手段である。
で生成された変形パターンを記憶する記憶手段である。
マツチング回路18は、送り込まれる文字パターンと記
入者パターン、正規化された文字パターンと標準パター
ン、変形文字パターンと標準パターンを夫々照合してマ
ツチングをとる機能を有する。
入者パターン、正規化された文字パターンと標準パター
ン、変形文字パターンと標準パターンを夫々照合してマ
ツチングをとる機能を有する。
−成度判定回路19は、マツチング回路18でのマツチ
ングの結果によって一致度を判定し、認識回路10aに
通知する機能を有する。
ングの結果によって一致度を判定し、認識回路10aに
通知する機能を有する。
このような構成及び機能を有するので、認識処理の方法
を第2図のフローチャートによって説明する。
を第2図のフローチャートによって説明する。
■まず帳票l上の文字が読み取られて、従来例と同様に
抽出回路7によって画像データの特徴が抽出されて認識
回路10aで辞書メモリ8から送られた文字の特徴と照
合されて一致度が求められる。
抽出回路7によって画像データの特徴が抽出されて認識
回路10aで辞書メモリ8から送られた文字の特徴と照
合されて一致度が求められる。
■−一致度判定回路1)において所定値(例えば70%
)に達しているか否かを判定して認識回路10aに通知
する。。
)に達しているか否かを判定して認識回路10aに通知
する。。
■そこで認識回路10aは一致度が所定値に達している
文字は認識の答、即ち、候補文字として送出される。
文字は認識の答、即ち、候補文字として送出される。
■もし一致度が低い場合には、画像データの文字パター
ンによって認識する方法に移行し、まず認識回路tOa
は1文字切出回路6から送られた切出文字のパターンを
マツチング回路18へ送り、また記入者パターンメモリ
14に指令して記入者パターンをマツチング回路18に
送らせて照合する。
ンによって認識する方法に移行し、まず認識回路tOa
は1文字切出回路6から送られた切出文字のパターンを
マツチング回路18へ送り、また記入者パターンメモリ
14に指令して記入者パターンをマツチング回路18に
送らせて照合する。
■照合結果は一致度判定回路19に送られて一致度が所
定値に達しているか否かを判定して認識回路10aに通
知する。
定値に達しているか否かを判定して認識回路10aに通
知する。
■認識回路10aはこの判定結果により、−成度が所定
値に達している時は、■と同様の処置を取ると共に、切
出文字のパターンは記入者パターンメモ1月4に送られ
て、照合された記入者パターンと置き換えて更新記憶さ
れ°る ■−一致度低い時は、切出文字の文字パターンを正規化
回路12へ送って正規化し、正規化文字パターンを正規
化文字パターンメモリ13に記憶する。
値に達している時は、■と同様の処置を取ると共に、切
出文字のパターンは記入者パターンメモ1月4に送られ
て、照合された記入者パターンと置き換えて更新記憶さ
れ°る ■−一致度低い時は、切出文字の文字パターンを正規化
回路12へ送って正規化し、正規化文字パターンを正規
化文字パターンメモリ13に記憶する。
0次に正規化文字パターンと標準パターンをマツチング
回路18に送って照合する。
回路18に送って照合する。
■照合の結果、■と同様に一致度が判定される。
[相]判定により、−成度が所定値に達している時は、
■と同様の処置を取ると共に、候補文字として認識され
た正規化パターンは記入者パターンメモリ14に送られ
、該当する文字の記入者パターンが更新される。
■と同様の処置を取ると共に、候補文字として認識され
た正規化パターンは記入者パターンメモリ14に送られ
、該当する文字の記入者パターンが更新される。
■−一致度低い時は、まず正規化文字パターンを変形パ
ターン生成回路1Gに送って一致度の低い部分のパター
ンを上下、または左右に移動させ、その文字の変形パタ
ーンを変形パターンメモリ17に記憶する。
ターン生成回路1Gに送って一致度の低い部分のパター
ンを上下、または左右に移動させ、その文字の変形パタ
ーンを変形パターンメモリ17に記憶する。
■そこで変形パターンと標準パターンをマツチング回路
18に送って照合する。
18に送って照合する。
■照合の結果、■と同様に一致度が判定される。
[相]−成度が所定値に達している時は、■と同様の処
置を取ると共に、候補文字として認識された変形パター
ンは記入者バタ、−ンメモリ14に送られ、該当する文
字の記入者パターンが更新される。
置を取ると共に、候補文字として認識された変形パター
ンは記入者バタ、−ンメモリ14に送られ、該当する文
字の記入者パターンが更新される。
[相]−成度が低い時は答としてリジェクト文字(例え
ば“?”)を出力する。
ば“?”)を出力する。
このようにして読み取られた画像データの文字の特徴に
基いてU!、!!処理を行い、−成度が低い時には文字
パターンに基く認識処理に移行し、しかも、より精度の
高いパターン照合を段階的に行うことより誤認識を防止
することができ、また認識の一致度が高い文字パターン
を記入者パターンメモ1月4に更新記憶するので、早い
段階で高い一致度を得ることができ認識処理の効率を高
めることができる。
基いてU!、!!処理を行い、−成度が低い時には文字
パターンに基く認識処理に移行し、しかも、より精度の
高いパターン照合を段階的に行うことより誤認識を防止
することができ、また認識の一致度が高い文字パターン
を記入者パターンメモ1月4に更新記憶するので、早い
段階で高い一致度を得ることができ認識処理の効率を高
めることができる。
以上説明したように本発明によれば、類似文字の誤認識
を減少させることができ、また認識処理の効率を高める
ことができるという効果がある。
を減少させることができ、また認識処理の効率を高める
ことができるという効果がある。
第1図は本発明による実施例を示すブロック図、第2図
は第1図のフローチャート、 第3図は従来方法を示すブロック図である。 図において、 4.4aは主制御部、 5は画像メモリ、6は1文字
切出口路、 7は特徴抽出回路、8は辞書メモリ、 9はフォーマット情報メモリ、 10、1(laは認識回路、 1)は判定回路、12は
正規化回路、 13は正規化文字パターン、 14は記入者パターンメモリ、 15は標準パターンメモリ、 16は変形パターン生成回路、 17は変形パターンメモリ・ 18はマツチング回路、 19は一致度判定回路を示す
。 1、唄
は第1図のフローチャート、 第3図は従来方法を示すブロック図である。 図において、 4.4aは主制御部、 5は画像メモリ、6は1文字
切出口路、 7は特徴抽出回路、8は辞書メモリ、 9はフォーマット情報メモリ、 10、1(laは認識回路、 1)は判定回路、12は
正規化回路、 13は正規化文字パターン、 14は記入者パターンメモリ、 15は標準パターンメモリ、 16は変形パターン生成回路、 17は変形パターンメモリ・ 18はマツチング回路、 19は一致度判定回路を示す
。 1、唄
Claims (4)
- (1)媒体上に記された文字に光を照射し、該照射した
光の反射光より得られた該文字の画像データを認識する
文字認識装置であって、前記画像データの文字の特徴に
基いて認識する第1の認識手段と、該画像データの文字
パターンに基いて認識する第2の認識手段とを備え、前
記第1の認識手段による認識の結果、認識の一致度が所
望値より低い時は、該当する画像データを前記第2の認
識手段によって認識することを特徴とする文字認識装置
。 - (2)前記第2の認識手段は、該第2の認識手段による
認識の都度記憶文字パターンが更新される記入者パター
ン記憶手段を備えることを特徴とする特許請求の範囲第
1項に記載の文字認識装置。 - (3)前記第2の認識手段は、前記画像データの大きさ
を正規化する正規化手段と、文字の標準パターンが記憶
される標準パターン記憶手段とを備えることを特徴とす
る特許請求の範囲第1項に記載の文字認識装置。 - (4)前記第2の認識手段は、前記正規化された画像デ
ータの一致度が低い部分を所定方向に移動させる変形パ
ターン生成手段を備えることを特徴とする特許請求の範
囲第3項に記載の文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP16364384A JPS6142083A (ja) | 1984-08-03 | 1984-08-03 | 文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP16364384A JPS6142083A (ja) | 1984-08-03 | 1984-08-03 | 文字認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS6142083A true JPS6142083A (ja) | 1986-02-28 |
JPH051512B2 JPH051512B2 (ja) | 1993-01-08 |
Family
ID=15777841
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP16364384A Granted JPS6142083A (ja) | 1984-08-03 | 1984-08-03 | 文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6142083A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6373982B1 (en) | 1998-05-07 | 2002-04-16 | International Business Machines Corporation | Process and equipment for recognition of a pattern on an item presented |
JP2008210388A (ja) * | 2007-02-26 | 2008-09-11 | Fujitsu Ltd | コードを識別する方法、装置及びプログラム |
JP2019168857A (ja) * | 2018-03-22 | 2019-10-03 | セイコーエプソン株式会社 | 画像処理装置、画像処理方法および画像処理プログラム |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005290656A (ja) * | 2004-03-10 | 2005-10-20 | Kyoto Kiito Kk | 糸芭蕉の繊維抽出法ならびに糸芭蕉糸および織物 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS511100A (en) * | 1974-06-22 | 1976-01-07 | Kyodo Printing Co Ltd | Pasuhoototoniokeru kaoshashinhyojisho |
JPS57103582A (en) * | 1980-12-20 | 1982-06-28 | Toshiba Corp | Character recognizing device |
-
1984
- 1984-08-03 JP JP16364384A patent/JPS6142083A/ja active Granted
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS511100A (en) * | 1974-06-22 | 1976-01-07 | Kyodo Printing Co Ltd | Pasuhoototoniokeru kaoshashinhyojisho |
JPS57103582A (en) * | 1980-12-20 | 1982-06-28 | Toshiba Corp | Character recognizing device |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6373982B1 (en) | 1998-05-07 | 2002-04-16 | International Business Machines Corporation | Process and equipment for recognition of a pattern on an item presented |
JP2008210388A (ja) * | 2007-02-26 | 2008-09-11 | Fujitsu Ltd | コードを識別する方法、装置及びプログラム |
JP2019168857A (ja) * | 2018-03-22 | 2019-10-03 | セイコーエプソン株式会社 | 画像処理装置、画像処理方法および画像処理プログラム |
Also Published As
Publication number | Publication date |
---|---|
JPH051512B2 (ja) | 1993-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7336827B2 (en) | System, process and software arrangement for recognizing handwritten characters | |
US5787197A (en) | Post-processing error correction scheme using a dictionary for on-line handwriting recognition | |
US5621818A (en) | Document recognition apparatus | |
JPS6142083A (ja) | 文字認識装置 | |
JPS6146573A (ja) | 文字認識装置 | |
JPS592191A (ja) | 手書き日本語文の認識処理方式 | |
JP3985926B2 (ja) | 文字認識方法、文字認識装置、文書画像処理システム及び記録媒体 | |
JPS60138689A (ja) | 文字認識方法 | |
Amin | Recognition of printed Arabic text using machine learning | |
JPH0256086A (ja) | 文字認識の後処理方法 | |
JP2963474B2 (ja) | 類似文字識別方法 | |
JP3033554B2 (ja) | 文字認識装置 | |
JP4092847B2 (ja) | 文字認識装置および文字認識方法 | |
JP2851865B2 (ja) | 文字認識装置 | |
Hinami et al. | Bidirectional extraction and recognition of scene text with layout consistency | |
JP2972443B2 (ja) | 文字認識装置 | |
JP2977244B2 (ja) | 文字認識方法及び文字認識装置 | |
JPS6143383A (ja) | 文字認識装置 | |
JPH0340186A (ja) | 文字認識装置 | |
JPS6133584A (ja) | 照合装置 | |
JPH07117995B2 (ja) | 文字認識装置 | |
JPS5994183A (ja) | 文字認識装置における辞書生成方式 | |
JPH06162266A (ja) | オンライン手書き文字認識の方法及びその装置 | |
JPS6160188A (ja) | 文字認識装置 | |
JPH1011542A (ja) | 文字認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |