JPH07152877A - 英文字認識装置 - Google Patents

英文字認識装置

Info

Publication number
JPH07152877A
JPH07152877A JP5301591A JP30159193A JPH07152877A JP H07152877 A JPH07152877 A JP H07152877A JP 5301591 A JP5301591 A JP 5301591A JP 30159193 A JP30159193 A JP 30159193A JP H07152877 A JPH07152877 A JP H07152877A
Authority
JP
Japan
Prior art keywords
character
unit
recognition
word
post
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5301591A
Other languages
English (en)
Inventor
Michiaki Nobuoka
道明 信岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP5301591A priority Critical patent/JPH07152877A/ja
Publication of JPH07152877A publication Critical patent/JPH07152877A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 高精度な認識結果を得ることの出来る英文字
認識装置を提供する。 【構成】 文字列を含む画像データを入力する文字入力
部1と、単語領域を抽出する単語切り出し部2と、文字
領域を抽出する文字切り出し部3と、文字領域内の画像
に認識辞書5をもとに認識を施す文字認識部4と、認識
結果が、固有名詞又は数字列でないかを判定することに
より、後処理を行うことが適当であるかを判定する後処
理判定部9と、スペル辞書7との照合により文字の訂正
を行う後処理部6と、訂正された認識結果を出力する認
識結果出力部とを備える。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、英文字の文字認識を行
う英文字認識装置に関するものである。
【0002】
【従来の技術】近年、電子計算機等の入力装置としてス
キャナなどの文字入力部から文字列を画像データとして
取込み、この画像データに文字認識を施す文字認識装置
であって、かつ安定した認識結果を効率的に得ることが
できるものに対する要求が高まってきている。
【0003】以下に従来の英文字認識装置について説明
する。図5は従来の英文字認識装置の機能ブロック図で
ある。図5中、1は認識対象となる文字列の画像データ
を入力するスキャナなどの文字入力部、2は文字入力部
1より入力された画像データから単語領域を抽出する単
語切り出し部、3は文字入力部1より入力された画像デ
ータより文字領域を抽出する文字切り出し部、4は文字
切り出し部3で求められた文字領域内の画像データがど
の文字を示すものであるかを、あらかじめ全ての認識対
象文字の特徴量を記憶している認識辞書5をもとに認識
を行う文字認識部、6は単語切り出し部2で抽出された
単語領域内において、文字認識部4の認識結果としての
文字からなる文字列と、あらかじめ英単語の綴りを記憶
しているスペル辞書7とを照合することより、文字認識
部4が誤認識した文字の訂正を行う後処理部、8は後処
理部6で訂正された認識結果を出力する認識結果出力部
である。
【0004】以上のように構成された従来の文字認識装
置について、以下、その動作を説明する。まず、文字入
力部1にて認識対象となる文字列の画像データを入力す
る。次に、単語切り出し部2にて、画像データにおける
ストロークのつながり、画像データにおける空間、また
オンライン入力の場合は、さらにそれぞれの文字の画像
を入力する時間の間隔等をもとに単語領域を抽出する。
また同様の方法で、文字切り出し部3にて、文字領域を
抽出する。次に文字切り出し部3にて切り出された文字
領域内の特徴量を抽出し、あらかじめすべての認識対象
文字の特徴量を記憶している認識辞書5をもとに文字領
域ごとに認識を行い各文字領域ごとの認識結果としての
文字を得る。次に、後処理部6にて単語切り出し部2に
て抽出された単語領域内において、文字認識部4の認識
結果としての文字からなる文字列と、あらかじめ英単語
の綴りを記憶しているスペル辞書7とを照合を行うこと
により、認識確度の低い文字がスペル辞書7の綴りと一
致しない場合、スペル辞書7におけるスペルと置き換え
ることによって、訂正を行う。次に、後処理部6にて修
正された認識結果を出力する。以上の処理を、入力され
た全ての文字列に対して行うことにより、全ての文字が
認識されることになる。
【0005】
【発明が解決しようとする課題】しかしながら、上記の
従来の英文字認識装置では、単にスペル辞書との単語照
合によってスペルの訂正を行っているため、固有名詞、
数字列等スペル辞書に記憶されていない単語に対して、
誤った訂正を行うという問題点を有していた。
【0006】本発明は、上記問題点を解決するもので、
高精度の認識結果を得ることが出来る英文字認識装置を
提供することを目的とする。
【0007】
【課題を解決するための手段】この目的を達成するため
に本発明の英文字認識装置は、認識対象文字の特徴量を
記憶している認識辞書と、英単語の綴りを記憶している
スペル辞書と、認識対象となる文字列の画像データを入
力する文字入力部と、文字入力部より入力された画像デ
ータより単語領域を抽出する単語切り出し部と、文字入
力部より入力された画像データより文字領域を抽出する
文字切り出し部と、文字切り出し部で求められた文字領
域内の画像データを認識辞書と比較して文字として認識
する文字認識部と、単語切り出し部で抽出された単語領
域内において文字認識部で認識された文字からなる文字
列が、固有名詞又は数字列であるか否かを判定すること
により、スペル辞書を用いて後処理を行うことが適当で
あるか否かを判定する後処理判定部と、後処理判定部に
おいて後処理を行うことが適当であると判定された場
合、単語切り出し部で抽出された単語領域内において文
字認識部で認識された文字からなる文字列と、スペル辞
書における綴りとの照合により誤認識した文字の訂正を
行う後処理部と、後処理部で訂正された認識結果を出力
する認識結果出力部とを備えている。
【0008】
【作用】この構成によって、後処理を行う前に、固有名
詞又は数字列でないかの判定を行うことにより、スペル
辞書内に存在しない単語を誤って文字置換することを防
ぐことが出来、高精度な認識結果を得ることが出来る。
【0009】
【実施例】以下、本発明の一実施例について、図面を参
照しながら説明する。図1は本発明の一実施例における
英文字認識装置の機能ブロック図であり、図2は同英文
字認識装置のブロック図である。
【0010】図1中、1は文字入力部、2は単語切り出
し部、3は文字切り出し部、4は文字認識部、5は認識
辞書、6は後処理部、7はスペル辞書、8は認識結果出
力部であり、これらは従来例と同様なので同一の符号を
付し説明を省略する。9は、単語切り出し部2で抽出さ
れた単語領域内における文字認識部4で認識された文字
からなる文字列が、固有名詞又は数字列でないかを判定
することにより、スペル辞書7を用いて後処理を行うこ
とが適当であるかを判定する後処理判定部である。
【0011】図2において、10は認識対象文字列の画
像データを入力するスキャナなどの入力装置、11は全
体の制御を行う中央処理装置(以下CPUと略称す
る)、12はCPU11が全体の制御を行うための制御
プログラム、15は制御プログラム12、認識辞書5、
スペル辞書7を記憶するリード・オンリ・メモリ、16
は入力された文字列の単語切り出し結果(画像デー
タ)、17は入力された文字列の文字切り出し結果(画
像データ)、18は認識結果(文字)、19は単語切り
出し結果16、文字切り出し結果17、認識結果18を
記憶するためのランダム・アクセス・メモリ、20は認
識結果を出力するための出力装置、21は内部バスであ
る。なお図1の文字入力部1は入力装置10により、単
語切り出し部2、文字切り出し部3、文字認識部4、後
処理判定部9及び後処理部6はCPU11が制御プログ
ラム12を実行することにより実現され、認識結果出力
部8は認識結果18を出力装置20が出力することによ
り実現される。
【0012】以上のように構成された文字認識装置につ
いて、図3の本発明の一実施例における英文字認識装置
の制御手順を示すフローチャートを用いて、以下その動
作を説明する。まず、文字入力部1にて認識対象となる
文字列の画像データを入力する(S1)。次に、単語切
り出し部2にて、ストロークのつながり、画像間の空
間、またオンライン入力の場合は、さらにそれぞれの画
像間の間隔等をもとに画像データのうちから単語領域を
抽出する(S2)。また同様の方法で、文字切り出し部
3にて、画像データのうちから文字領域を抽出する(S
3)。次に文字認識部4において、文字切り出し部3に
て切り出された文字領域内の特徴量を抽出し、あらかじ
めすべての認識対象文字の特徴量を記憶している認識辞
書5をもとに文字領域の画像データごとに認識を行う
(S4)。次にスペル辞書7を用いて後処理を行うこと
が適当であるかの判定処理を行う(S5)。
【0013】以下、図4の本発明の一実施例における英
文字認識装置の後処理を行うのが適当かを判定する処理
方法を示すフローチャートを参照しながら、本実施例に
おける英文字認識装置にて図3のS5の後処理判定処理
を説明する。この処理では判定フラグを用いるが、この
判定フラグには、後処理を行う必要があるとき「1」の
値、そうでない場合「0」の値が与えられる。
【0014】まず、初期状態では判定フラグの値を
「0」とする(S51)。次に、単語切り出し部2にて
切り出された結果及び文字切り出し部3にて切り出され
た認識結果をもとに単語内の文字列を抽出する(S5
2)。次に抽出された単語内に数字列が存在しないかを
調べ(S53)、存在する場合は判定フラグの値を
「1」にする(S58)。S53にて数字列が存在しな
い場合、この単語が文の先頭の単語ではなくかつこの単
語の先頭の文字が大文字でないかを調べ(S54)、文
の先頭でなく単語の先頭が大文字である場合、固有名詞
とみなし判定フラグの値を「1」にする(S58)。S
54にて固有名詞とみなされなかった場合、単語内文字
列が敬称(Mr.、Miss、Mrs.、Ms.、D
r.)でないかを調べ(S55)、敬称であれば、次の
単語の文字列を抽出し(S56)、この文字列の先頭の
文字が大文字であるかを調べる(S57)。先頭の文字
が大文字である場合、判定フラグの値を「1」とする
(S58)。以上で、後処理を行うのが適当かを判定す
る処理を終了する。
【0015】さて図1に示すように以下図3のS5に
て、後処理を行うことが適当であると判定された(判定
フラグの値が「1」)場合、後処理部6にて単語切り出
し部2にて抽出された単語領域内において文字認識部4
の認識結果としての文字からなる文字列と、スペル辞書
7との照合を行い、認識確度の低い文字がスペル辞書7
の綴りと相違する際に、これをスペル辞書7中のスペル
と置き換えることによって、訂正を行う(S6)。次
に、後処理部6にて修正された認識結果を出力する(S
7)。以上S1〜S7の処理を、入力された全ての画像
データに対して行うことにより、画像データ中に含まれ
る全ての文字が認識されることになる。
【0016】
【発明の効果】以上のように本発明は、文字認識を行っ
た後、固有名詞、数字列でないかの判定を行い後処理を
行うことが適当であるかどうかを判定し、後処理を行う
ことが適当であると判定された場合のみ、後処理を行う
ことにより、高精度な英文字認識装置を実現できる。
【図面の簡単な説明】
【図1】本発明の一実施例における英文字認識装置の機
能ブロック図
【図2】本発明の一実施例における英文字認識装置のブ
ロック図
【図3】本発明の一実施例における英文字認識装置の制
御手順を示すフロチャート
【図4】本発明の一実施例における英文字認識装置の後
処理を行うのが適当かを判定する処理方法を示すフロチ
ャート
【図5】従来の英文字認識装置の機能ブロック図
【符号の説明】
1 文字入力部 2 単語切り出し部 3 文字切り出し部 4 文字認識部 5 認識辞書 6 後処理部 7 スペル辞書 8 認識結果出力部 9 後処理判定部 10 入力装置 11 中央処理装置 12 制御プログラム 15 リード・オンリ・メモリ 16 単語切り出し結果 17 文字切り出し結果 18 認識結果 19 ランダム・アクセス・メモリ 20 出力装置 21 内部バス

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】認識対象文字の特徴量を記憶している認識
    辞書と、英単語の綴りを記憶しているスペル辞書と、認
    識対象となる文字列の画像データを入力する文字入力部
    と、前記文字入力部より入力された画像データより単語
    領域を抽出する単語切り出し部と、前記文字入力部より
    入力された画像データより文字領域を抽出する文字切り
    出し部と、前記文字切り出し部で求められた文字領域内
    の画像データを前記認識辞書と比較して文字として認識
    する文字認識部と、前記単語切り出し部で抽出された単
    語領域内において前記文字認識部で認識された文字から
    なる文字列が、固有名詞又は数字列であるか否かを判定
    することにより、前記スペル辞書を用いて後処理を行う
    ことが適当であるか否かを判定する後処理判定部と、前
    記後処理判定部において後処理を行うことが適当である
    と判定された場合、前記単語切り出し部で抽出された単
    語領域内において前記文字認識部で認識された文字から
    なる文字列と、前記スペル辞書における綴りとの照合に
    より誤認識した文字の訂正を行う後処理部と、前記後処
    理部で訂正された認識結果を出力する認識結果出力部と
    を備えたことを特徴とする英文字認識装置。
JP5301591A 1993-12-01 1993-12-01 英文字認識装置 Pending JPH07152877A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5301591A JPH07152877A (ja) 1993-12-01 1993-12-01 英文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5301591A JPH07152877A (ja) 1993-12-01 1993-12-01 英文字認識装置

Publications (1)

Publication Number Publication Date
JPH07152877A true JPH07152877A (ja) 1995-06-16

Family

ID=17898800

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5301591A Pending JPH07152877A (ja) 1993-12-01 1993-12-01 英文字認識装置

Country Status (1)

Country Link
JP (1) JPH07152877A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100582039B1 (ko) * 1999-05-06 2006-05-23 후지쯔 가부시끼가이샤 문자 인식 장치

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100582039B1 (ko) * 1999-05-06 2006-05-23 후지쯔 가부시끼가이샤 문자 인식 장치

Similar Documents

Publication Publication Date Title
US20110229036A1 (en) Method and apparatus for text and error profiling of historical documents
EP2138959B1 (en) Word recognizing method and word recognizing program
CN110929514B (zh) 文本校对方法、装置、计算机可读存储介质及电子设备
JP2000089786A (ja) 音声認識結果の修正方法および装置
JPH07152877A (ja) 英文字認識装置
JPH076215A (ja) ニューラルネットワークに基づく文字処理装置のための字句の後処理方法
JPH0619962A (ja) テキスト分割装置
JP4633271B2 (ja) 辞書学習方法及び辞書学習プログラム
JP2908460B2 (ja) 誤認識修正方法及び装置
JP2002207960A (ja) 認識文字修正方法及び認識文字修正プログラム
JP4318223B2 (ja) 文書校正装置およびプログラム記憶媒体
JP3085107B2 (ja) 文字認識装置
JP2838850B2 (ja) 仮名漢字変換装置
JP2922949B2 (ja) 文字認識の後処理方法
JP3595081B2 (ja) 文字認識方法
JPH0765130A (ja) 文字認識装置
JPH10240736A (ja) 形態素解析装置
JPH11120294A (ja) 文字認識装置および媒体
JPS63150788A (ja) 文字認識装置
CN117422064A (zh) 搜索文本纠错方法、装置、计算机设备及存储介质
JPH0728944A (ja) 英文字認識装置
JP3111522B2 (ja) 認識文字修正方法
JPH03156589A (ja) 誤読文字の検出,修正方法
JPH04252390A (ja) 文字認識結果の後処理方法
JPS60138689A (ja) 文字認識方法