JP3114446B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP3114446B2
JP3114446B2 JP05203051A JP20305193A JP3114446B2 JP 3114446 B2 JP3114446 B2 JP 3114446B2 JP 05203051 A JP05203051 A JP 05203051A JP 20305193 A JP20305193 A JP 20305193A JP 3114446 B2 JP3114446 B2 JP 3114446B2
Authority
JP
Japan
Prior art keywords
recognition
character
unit
image
item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP05203051A
Other languages
English (en)
Other versions
JPH0757052A (ja
Inventor
磨理子 竹之内
穂 高倉
里志 江村
一郎 中尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP05203051A priority Critical patent/JP3114446B2/ja
Publication of JPH0757052A publication Critical patent/JPH0757052A/ja
Application granted granted Critical
Publication of JP3114446B2 publication Critical patent/JP3114446B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、帳票や名刺など複数項
目が記載された文書の記載事項を読み取る文字認識装置
に関するものである。
【0002】
【従来の技術】従来の文字認識装置では、認識対象画像
の記載事項を項目毎に認識し、後処理を行って認識結果
を修正していた。
【0003】図7に従来の文字認識装置の構成図を示
す。101は認識対象画像を入力する画像入力部であ
る。102は認識対象画像から記載事項の各項目毎の画
像を抽出する項目画像抽出部である。103は項目画像
から文字画像を切り出す文字切り出し部である。104
は文字画像を認識し認識候補文字を抽出する文字認識部
である。105は認識候補文字の修正を行う後処理部で
ある。106は認識結果を表示する出力部である。
【0004】以上のように構成された従来の文字認識装
置では、画像入力部101で入力した認識対象画像か
ら、項目画像抽出部102で記載事項の各項目毎の画像
を抽出し、各項目毎に文字切り出し部103で項目画像
から文字画像を切り出し、文字認識部104で文字画像
を認識して認識候補文字を抽出し、後処理部105で認
識候補文字を修正し、出力部106で各項目毎に認識結
果を表示する。
【0005】
【発明が解決しようとする課題】しかしながら従来の文
字認識装置では、認識対象画像の記載事項を項目毎に認
識し、後処理を行って認識結果を修正していたので、後
処理を行う項目についても、後処理を行わない項目と同
じ認識処理をするので処理に時間を有するという問題点
を有していた。
【0006】本発明は上記問題点に鑑み、後処理を行う
項目については、認識に用いる特徴の種類を削減するこ
とにより、処理時間を削減することができる文字認識装
置を提供することを目的とする。
【0007】
【課題を解決するための手段】前記課題を解決するた
め、本発明は、認識対象画像を入力する画像入力部と、
前記画像入力部で入力された認識対象画像から各記載項
目の画像を抽出する項目画像抽出部と、前記項目画像抽
出部で抽出された項目画像から文字画像を切り出す文字
切り出し部と、各記載項目の内で認識候補文字の後処理
をしない項目については、認識に用いる特徴の種類を全
種類とし、各記載項目の内で認識候補文字の後処理をす
る項目については、認識に用いる特徴の種類を削減する
特徴数設定部と、前記特徴数設定部で設定した特徴の種
類に従って、記載項目毎に前記文字切り出し部で切り出
した文字画像を認識し、認識候補文字を抽出する文字認
識部と、各記載項目の内で認識候補文字の後処理をする
項目については、前記文字認識部で抽出した認識候補文
字を修正する後処理部とを有する。
【0008】
【作用】本発明は前記した技術的手段により、画像入力
部で入力した認識対象画像から、項目画像抽出部で記載
事項の各項目毎の画像を抽出し、各項目毎に文字切り出
し部で項目画像から文字画像を切り出し、各記載項目の
内で認識候補文字の後処理をしない項目については、特
徴数設定部で認識に用いる特徴の種類を全種類とし、各
記載項目の内で認識候補文字の後処理をする項目につい
ては、特徴数設定部で認識に用いる特徴の種類を削減
し、特徴数設定部で設定した特徴の種類に従って、文字
認識部で記載項目毎に切り出した文字画像を認識し、各
記載項目の内で認識候補文字の後処理をする項目につい
ては、文字認識部で抽出した認識候補文字を修正する。
【0009】
【実施例】以下本発明の一実施例の文字認識装置につい
て、図面を参照しながら説明する。
【0010】図1は、本発明による文字認識装置の一実
施例の構成図である。1は画像入力部であり、認識対象
画像を入力する。2は、項目画像抽出部であり、画像入
力部1で入力された認識対象画像から各記載項目の画像
を抽出する。3は文字切り出し部であり、項目画像抽出
部2で抽出された項目画像から文字画像を切り出す。4
は後処理項目選択部であり、認識対象画像の各記載項目
の内で後処理をする項目を選択する。5は特徴数設定部
であり、認識に用いる特徴の種類を設定する。6は文字
認識部であり、特徴数設定部5で設定した特徴の種類に
従って、記載項目毎に文字切り出し部3で切り出した文
字画像を認識辞書61と照合し、認識候補文字を抽出す
る。7は後処理部であり、後処理項目選択部4で選択し
た認識候補文字の後処理をする項目については、文字認
識部6で抽出した認識候補文字を単語辞書71と照合し
修正する。8は表示部であり、認識結果を表示する。
【0011】上述した文字認識装置について、図2の認
識対象画像Pを例に、以下その動作の詳細を説明する。
画像入力部1では、認識対象画像Pをスキャナから入力
する。項目画像抽出部2で認識対象画像Pから各項目の
画像を抽出し、文字切り出し部3で各項目の画像から文
字画像を切り出す。後処理項目選択部4では、第3図に
示すように、表示部8に認識対象画像Pの記載項目の一
覧が表示されているので、オペレータが後処理をさせた
い項目「氏名」「住所」を選択すると、表示部8の記載
項目の一覧の選択された項目の前に「●」を表示する。
後処理をする項目が選択されると、特徴数設定部5で
は、第4図に示すように、文字認識部6で認識辞書61
との照合に用いる特徴数を設定する。後処理をしない項
目「生年月日」「交付」「免許証番号」については、N
次元ある特徴量の全てを用いることにし、特徴数パラメ
ータJにNを設定する。後処理をする項目「氏名」「住
所」については、N次元ある特徴量の1番目からM番目
(M<N)までを用いることにし、特徴数パラメータJ
にMを設定する。文字認識部6では、特徴数設定部5で
設定された特徴数パラメータJの値にしたがって、各項
目毎に文字切り出し部3で切り出した文字画像の1番目
からJ番目の特徴量を求めて、認識辞書61とで照合
し、距離Diの最も小さいK個の認識候補文字を抽出す
る。
【0012】
【数1】
【0013】(数1)において、Fijは認識辞書61
に登録されているi番目の文字の標準特徴量であり、f
jは切り出した文字画像の特徴量である。図5に第1位
認識候補文字の抽出結果を示す。後処理部7では、文字
認識部6で抽出した「氏名」項目の認識候補文字を単語
辞書71と照合すると、図5に示すように第1位認識候
補文字は「山H 太郎」であるが、単語辞書71に存在
しない氏名であるので第2位以下の認識候補文字から単
語辞書71に存在する「山田 太郎」に修正し、図6に
示すように認識結果として表示部8に表示する。同様
に、文字認識部6で抽出した「住所」項目の認識候補文
字を単語辞書71と照合すると、図5に示すように第1
位認識候補文字は「大阪府大分市梅田3」であるが、単
語辞書71に存在しない住所であるので第2位以下の認
識候補文字から単語辞書71に存在する「大阪府大阪市
梅田3」に修正し、図6に示すように認識結果として表
示部8に表示する。表示部8では、図6に示すように、
後処理項目選択部4で選択されなかった「生年月日」
「交付」「免許証番号」項目の第1位認識候補文字を認
識結果として表示する。
【0014】以上のように本実施例では、特徴数設定部
5で、各記載項目毎に認識処理に用いる特徴数を特徴数
パラメータJに設定するだけで、文字認識部6では記載
項目に合わせて処理を変えることなく、切り出した文字
画像の1番目からJ番目の特徴量を求めて、同じ(数
1)で認識辞書との照合ができるので、簡易な方法で処
理時間を削減することができる。
【0015】
【発明の効果】以上のように本発明は、各記載項目の内
で認識候補文字の後処理をしない項目については、特徴
数設定部で認識に用いる特徴の種類を全種類とし、各記
載項目の内で認識候補文字の後処理をする項目について
は、特徴数設定部で認識に用いる特徴の種類を削減し、
特徴数設定部で設定した特徴の種類に従って、文字認識
部で記載項目毎に切り出した文字画像を認識し、各記載
項目の内で認識候補文字の後処理をする項目について
は、後処理部で抽出した認識候補文字を修正することに
より、処理時間を削減することができる。
【図面の簡単な説明】
【図1】本発明の実施例における文字認識装置の構成図
【図2】認識対象画像の例の説明図
【図3】後処理項目選択部4の動作の説明図
【図4】特徴数設定部5の動作の説明図
【図5】認識部6の動作の説明図
【図6】後処理部7及び表示部8の動作の説明図
【図7】従来の文字認識装置の概略図
【符号の説明】
1 画像入力部 2 項目画像抽出部 3 文字切り出し部 4 後処理項目選択部 5 特徴数設定部 6 文字認識部 61 認識辞書 7 後処理部 71 単語辞書 8 表示部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 中尾 一郎 大阪府門真市大字門真1006番地 松下電 器産業株式会社内 (56)参考文献 特開 平3−161891(JP,A) 特開 昭63−138479(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/46 G06K 9/72 JICSTファイル(JOIS)

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】認識対象画像の記載事項を読み取る文字認
    識装置において、認識対象画像を入力する画像入力部
    と、前記画像入力部で入力された認識対象画像から各記
    載項目の画像を抽出する項目画像抽出部と、前記項目画
    像抽出部で抽出された項目画像から文字画像を切り出す
    文字切り出し部と、各記載項目の内で認識候補文字の後
    処理をしない項目については、認識に用いる特徴の種類
    を全種類とし、各記載項目の内で認識候補文字の後処理
    をする項目については、認識に用いる特徴の種類を削減
    する特徴数設定部と、前記特徴数設定部で設定した特徴
    の種類に従って、記載項目毎に前記文字切り出し部で切
    り出した文字画像を認識し、認識候補文字を抽出する文
    字認識部と、各記載項目の内で認識候補文字の後処理を
    する項目については、前記文字認識部で抽出した認識候
    補文字を修正する後処理部とを有することを特徴とする
    文字認識装置。
JP05203051A 1993-08-17 1993-08-17 文字認識装置 Expired - Fee Related JP3114446B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP05203051A JP3114446B2 (ja) 1993-08-17 1993-08-17 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP05203051A JP3114446B2 (ja) 1993-08-17 1993-08-17 文字認識装置

Publications (2)

Publication Number Publication Date
JPH0757052A JPH0757052A (ja) 1995-03-03
JP3114446B2 true JP3114446B2 (ja) 2000-12-04

Family

ID=16467532

Family Applications (1)

Application Number Title Priority Date Filing Date
JP05203051A Expired - Fee Related JP3114446B2 (ja) 1993-08-17 1993-08-17 文字認識装置

Country Status (1)

Country Link
JP (1) JP3114446B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH067554U (ja) * 1991-12-16 1994-02-01 裕人 永田 足 枕
US9074739B2 (en) 2012-01-06 2015-07-07 Pelican Products, Inc. Flashlight with multiple light sources

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022088183A (ja) * 2020-12-02 2022-06-14 株式会社三菱Ufj銀行 帳票読取装置及び帳票読取方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH067554U (ja) * 1991-12-16 1994-02-01 裕人 永田 足 枕
US9074739B2 (en) 2012-01-06 2015-07-07 Pelican Products, Inc. Flashlight with multiple light sources

Also Published As

Publication number Publication date
JPH0757052A (ja) 1995-03-03

Similar Documents

Publication Publication Date Title
US9639751B2 (en) Property record document data verification systems and methods
JP2713622B2 (ja) 表形式文書読取装置
US20210264189A1 (en) Text Recognition Method and Apparatus, Electronic Device, and Storage Medium
CN111368841A (zh) 文本识别方法、装置、设备及存储介质
Andreeva et al. Comparison of scanned administrative document images
JP3114446B2 (ja) 文字認識装置
JP3573945B2 (ja) フォーマット認識装置及び文字読み取り装置
JPH09204492A (ja) 帳票処理装置
JP2004164674A (ja) フォーマット認識装置及び文字読み取り装置
US20220044048A1 (en) System and method to recognise characters from an image
JPH08180068A (ja) 電子ファイリング装置
JP3440501B2 (ja) 運転免許証認識装置
JP2001126010A (ja) 帳票処理装置、帳票定義作成方法、領域抽出方法及び記憶媒体
JP4887867B2 (ja) 文字読み取り装置
JP3548233B2 (ja) 文字認識装置及び方法
CN111242112A (zh) 一种图像处理方法、身份信息处理方法及装置
JP2001022883A (ja) 文字認識方式及び該文字認識方式の機能を実現させるための記録媒体
JP3339122B2 (ja) 運転免許証認識装置
CN115131806B (zh) 一种基于深度学习的各类证件ocr图像信息识别方法、系统
JP3360030B2 (ja) 文字認識装置および文字認識方法および文字認識方法をプログラムの形で記録した記録媒体
JP7231529B2 (ja) 情報端末装置、サーバ及びプログラム
JP3116453B2 (ja) 英文字認識装置
JP3620299B2 (ja) 文書ファイリング装置及び文書ファイリング方法
JPH07152856A (ja) 光学的文字読取装置
JP3251704B2 (ja) 認識処理装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees