JP3457376B2 - 光学式読み取り装置における文字修正方法 - Google Patents

光学式読み取り装置における文字修正方法

Info

Publication number
JP3457376B2
JP3457376B2 JP05517694A JP5517694A JP3457376B2 JP 3457376 B2 JP3457376 B2 JP 3457376B2 JP 05517694 A JP05517694 A JP 05517694A JP 5517694 A JP5517694 A JP 5517694A JP 3457376 B2 JP3457376 B2 JP 3457376B2
Authority
JP
Japan
Prior art keywords
character
recognition
characters
displayed
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP05517694A
Other languages
English (en)
Other versions
JPH07239901A (ja
Inventor
清 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP05517694A priority Critical patent/JP3457376B2/ja
Publication of JPH07239901A publication Critical patent/JPH07239901A/ja
Application granted granted Critical
Publication of JP3457376B2 publication Critical patent/JP3457376B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、光学式読み取り装置に
おいて認識した文字を画面上で修正する文字修正方法に
関する。
【0002】
【従来の技術】光学式読み取り装置(以下、単にOCR
と言う。)は、帳票に記入された種々の文字からの反射
光をスキャナ等の光学式センサにて取り込み、所定の画
像処理によって文字を認識してその結果をディスプレイ
等の表示部に表示する装置である。
【0003】このOCRにて文字認識を行うには、スキ
ャナ等にて取り込んだ文字の反射光の信号(画像デー
タ)を所定の領域(例えば、文字単位)で切り出し、各
領域毎にパターンマッチング等の画像処理を行ってそれ
が何の文字であるかを認識する。そして、OCRの制御
部からの指示によってその認識結果をディスプレイ等の
表示部に表示している。オペレータは、この表示結果を
見ることで認識結果が正しいか否かを判定し、もし間違
って認識していたり、読み取り不良となっている場合に
はその修正を行っている。
【0004】
【発明が解決しようとする課題】オペレータが誤認識部
分や認識不良部分を修正するには、先ずキーボードを用
いてディスプレイ上の修正部分を削除し、その後、削除
した部分に新たな入力を加え、かな漢字変換等の所定の
処理を行って埋め合わせを行っている。この帳票に記入
された文字の字体や文字種が混在している場合には文字
認識部による正確な認識が困難となる。特に、活字体や
スタンプ体、手書きなどが混じって記入されている場合
には、それぞれの字体によってピッチが異なるため、画
像データを文字単位での切り出すことが困難となり認識
不良を起こしやすく、オペレータは修正作業を頻繁に行
わなければならない。漢字や記号、アルファベットなど
多種の文字が混在している場合にはさらに正確な認識が
困難となる。このように、認識不良や誤認識が多い場合
にはオペレータによる修正作業が長時間となり、多大な
労力が必要となる。
【0005】
【課題を解決するための手段】本発明は、このような課
題を解決するために成された光学式読み取り装置におけ
る文字修正方法である。すなわち、本発明の光学式読み
取り装置における文字修正方法は、帳票に記入された種
々の字体から成る文字の反射光を光学式センサにて受光
し、その受光信号に基づいて文字認識を行ってその結果
を画面に表示した後、その表示内容の修正を行う方法で
あり、表示内容に認識不良があった場合には先ずその認
識不良部分を画面上で指定し、次いでその認識不良部分
に対応する文字の字体を指定した後、この字体に限定し
て認識不良部分の再認識を行い、その再認識結果を画面
上の認識不良部分に表示して修正を行っている。
【0006】また、表示内容に誤認識があった場合に
は、その誤認識部分を画面上で指定し、次いで、その誤
認識部分に対応する文字の区分に応じた辞書を指定した
後、その辞書内の文字に限定して誤認識部分の再認識を
行って表示させたり、誤認識部分を画面上で指定した
後、誤認識部分に対応する文字の種類を指定し、その種
類の文字に限定して文字の認識の候補となる文字群を表
示し、その表示内容からオペレータの操作によって正確
な文字を選択して表示させたりする修正方法でもある。
【0007】さらに、誤認識部分を画面上で指定した
後、その誤認識部分に対応する文字と同音かつ同意で異
形の文字、例えば正字に対する旧字や略字、俗字、また
は旧字、略字、俗字に対する正字を表示し、その表示内
容からオペレータの操作によって正確な文字を表示させ
る修正方法でもある。
【0008】
【作用】本発明は、誤認識部分を画面上で指定した後、
その部分の正字に対応する候補文字群を表示するととも
に、その正字に対応する略字、旧字、俗字のような同音
同意で異形の文字を候補文字の下方に表示することか
ら、オペレータによる短時間での選択ができるようにな
る。
【0009】
【実施例】以下に、本発明の光学式読み取り装置におけ
る文字修正方法を図に基づいて説明する。図1は光学式
読み取り装置(以下、単にOCRと言う。)の構成を示
すブロック図である。OCRは、帳票1に記入された文
字からの反射光を取り込むための光学式センサ等を備え
たスキャナ部2と、スキャナ部2からの受光信号(画像
データ)を所定の領域に分割する文字切り出し部3と、
切り出した領域単位で文字の認識を行う文字認識部4
と、文字の認識結果を表示するディスプレイ等から成る
表示部5と、所定の入力を行うキーボード部6およびマ
ウス7と、これらに対する一連の制御を行うための制御
部8とから構成されている。
【0010】本発明はこのような構成から成るOCRを
用いた認識文字の修正方法であり、先ず、図2〜図3に
基づき第1実施例を説明する。なお、以下の実施例にお
いて用いる図に示されない符号は図1を参照するものと
する。第1実施例は、図2に示すような帳票1に記入さ
れた文字の認識を行う場合の修正方法である。すなわ
ち、この帳票1の記入枠11には活字、スタンプ、手書
き等の種々の字体から成る文字が記入されており、各字
体毎に文字の間隔すなわちピッチが異なっている。
【0011】図3(a)は、このような帳票1の文字を
図1に示すスキャナ部2にて読み取り、読み取った画像
データの切り出しを行った状態を示している。通常、O
CRは最も頻繁に記入される文字の字体に合わせて切り
出し領域Sのピッチを設定している。このため、例えば
手書きに合わせて切り出し領域Sのピッチを設定してあ
る場合、これよりも小さいピッチで記入された活字等に
おいては一つの切り出し領域S内に例えば1.5文字分
程度が入ってしまい、文字の認識不良を起こすことにな
る。
【0012】図3(b)は最初の認識後の状態を示す図
であり、例えば活字で記入された領域やスタンプで記
入された領域などが認識不良を起こして「?」が表示
部5に表示される状態となる。そこで、第1実施例にお
いては、オペレータは先ずディスプレイ等の表示部5上
において「?」が表示された部分をマウス7を用いて指
定する。そして、「?」で表示された認識不良部分を指
定した後、図3(c)に示すような画面60上にて所定
の字体の選択を行う。
【0013】すなわち、認識不良部分に対応する文字が
どんな字体であるかをオペレータが判断し、その字体を
例えばマウス7を用いて画面60上で指定する。例え
ば、図3(b)に示す領域の場合には、そこに対応す
る文字が活字であるため、オペレータは画面60に示さ
れたメニューバー61から字体を選び、さらにプルダウ
ンメニュー62の活字を選択する。OCRの制御部8
は、この選択に基づき認識不良部分である領域を活字
の字体に限定して再認識するよう文字切り出し部3およ
び文字認識部4に指示を与える。
【0014】この再認識を行うにあたり文字切り出し部
3は、領域に対応する画像データを先に選択された活
字のピッチに応じて再度切り出しを行う。これによっ
て、切り出し領域S内に1文字分が当てはまるようにな
り、文字認識部4は領域内の各文字を正確に認識する
ことができるようになる。同様に、領域に対してはメ
ニューバー61から字体を選び、さらにプルダウンメニ
ュー62のスタンプを選択する。文字切り出し部3は、
この選択されたスタンプのピッチに応じて画像データの
切り出しを行い、これに基づき文字認識部4が正確が認
識を行う。これによって、図3(d)に示すような正確
な認識結果を容易に得ることができるようになる。
【0015】次に、本発明の第2実施例を図4〜図5に
基づいて説明する。図4(a)は帳票1の記入状態を示
した図であり、この帳票1の記入枠11には漢字、英文
字および数字等から文字(例えば、人名とそれを示すロ
ーマ字や年齢等)が記入されている。通常、文字認識部
4においては文字の種類や文字が示す意味を区別せず、
切り出された画像データから文字の認識を行っている。
このため、認識後においては図4(b)に示すように、
例えば記号である「(」をひらがなの「し」と誤認識し
たり、英文字の「O」を数字の「0」と誤認識したり、
漢字の「才」をカタカナの「オ」と誤認識したりする。
【0016】そこで、第2実施例においては、先ず、オ
ペレータによるマウス7の操作によってディスプレイ等
の表示部5上でその誤認識部分を指定する。図4(c)
は誤認識部分を指定した状態を示す図であり、例えば図
中〜までの4箇所を指定している。次いで、図5
(a)に示すように、誤認識部分として指定した位置に
対応する文字が区分される辞書の指定を行う。
【0017】例えば、記号は記号辞書に、英文字はアル
ファベット辞書に、漢字は漢字辞書にそれぞれ区分して
記憶されている。そこで、誤認識部分として指定した例
えばの場合には、対応する文字「(」が記号であるた
め画面60のメニューバー61から辞書を選択し、さら
にプルダウンメニュー62から記号を選択する。制御部
8はこの選択に基づき文字認識部4に指示を与え、文字
認識部4は誤認識部分を選択された記号辞書内におい
て再認識する。
【0018】この再認識によって文字認識部4は誤認識
部分の画像データを記号辞書内の文字に限定してパタ
ーンマッチングし、その中で最も適合する文字を第1候
補とする。これにより、例えば「(」が第1候補となっ
た場合にはその第1候補である「(」を誤認識部分に
表示する。なお、第1候補が「(」でない場合(例えば
「<」)であった場合には、その「<」が表示される
が、この表示とともに図5(b)に示すような他の候補
である候補文字群10を表示させてもよい。
【0019】オペレータはこの候補文字群10の中から
「(」をマウス7等により選択し、これによって誤認識
部分が「(」となる。また、誤認識部分について
は、オペレータがメニューバー61の辞書の中からプル
ダウンメニュー62内のアルファベットを選択し、これ
によって文字認識部4はアルファベット辞書内において
誤認識部分の再認識を行う。同様に、誤認識部分に
ついてはプルダウンメニュー62内の記号を選択し、誤
認識部分についてはプルダウンメニュー62内のカタ
カナを選択し、それぞれ再認識を行う。これによって、
種々の文字が混在していても確実に認識を行うことがで
きるようになり、図5(c)に示すような修正を行うこ
とができる。
【0020】また、漢字やアルファベット等の文字の種
類から成る辞書以外に、人名や地名、オペレータが独自
に使用するユーザ辞書等を選択してもよい。例えば、帳
票1に記入された「小林」が人名を示す場合において、
OCRがこれを誤認識してしまった場合には、その部分
を指定してプルダウンメニュー62のその他を選択し、
さらにその他の中の図示しない人名を選択する。これに
より、文字認識部4にて人名辞書に限定した再認識を行
うことで、確実に「小林」を認識することができるよう
になる。すなわち、誤認識した部分に対応する文字の区
分に応じた辞書を選択することで確実にしかも容易に文
字修正を行うことができる。
【0021】次に、図6〜図7に基づいて本発明の第3
実施例を説明する。図6(a)は帳票1の記入状態を示
した図であり、この帳票1の記入枠11には漢字、英文
字および数字等から文字が記入されている。通常、文字
認識部4においては文字の種類を区別せず、切り出され
た画像データから文字の認識を行っている。このため、
認識後においては図6(b)に示すように、例えば記号
である「(」をひらがなの「し」と誤認識したり、英文
字の「O」を数字の「0」と誤認識したり、漢字の
「才」をカタカナの「オ」と誤認識したりする。
【0022】そこで、第3実施例においては、先ず、オ
ペレータによるマウス7の操作によってディスプレイ等
の表示部5上でその誤認識部分である例えば図中〜
までの4箇所を指定する。次いで、図6(c)に示すよ
うに、誤認識部分として指定した位置と対応する文字の
文字種を指定する。
【0023】例えば、誤認識部分の場合には、本来
「(」であるため画面60のメニューバー61から文字
種を選択し、さらにプルダウンメニュー62から記号を
選択する。この選択により制御部8は文字認識部4に対
して指示を与え、これに基づいて文字認識部4は誤認識
部分に対応する認識当初の候補文字の中から記号のみ
に限定した文字群を形成する。すなわち、図7(a)に
示すように、先ず認識当初の候補文字から成る第1の候
補文字群10aを記号のみに絞り込み、その絞り込んだ
結果を第2の候補文字群10bとしてディスプレイ等に
表示する。
【0024】例えば、多数の候補文字がある第1の候補
文字群10aの中のうち、記号の第1候補となるのが
「<」であった場合には、一旦誤認識部分を「<」に
置き換えて表示し、これとともに第2の候補文字群10
bを表示する。そして、修正したい文字が「<」でない
場合には表示された第2の候補文字群10bの中からオ
ペレータによるマウス7の操作によって修正したい例え
ば「(」を選び、この「(」を誤認識部に表示する。
【0025】同様に、誤認識部分の場合にはプルダウ
ンメニュー62からアルファベットを選択し、アルファ
ベットに限定した候補文字の絞り込みを行う。また、誤
認識部分の場合には記号を選択し、誤認識部分の場
合には漢字を選択してそれぞれ絞り込みを行う。これに
よって、迅速な文字修正作業を行うことができるように
なる。
【0026】次に、本発明の第4実施例を図8〜図9に
基づいて説明する。図8(a)は帳票1の記入状態を示
す図であり、記入枠11に例えば手書きによって漢字が
記入されている。また、漢字の記入に際して、例えば
「問」の文字を略した同音かつ同意である異形文字12
を用いて書く場合がある。このような文字を認識する場
合には、図8(b)に示すように正字13である例えば
「問」と誤認識してディスプレイ等に表示することがあ
る。
【0027】そこで、これを修正するため第4実施例に
おいては先ず誤認識部分の指定を行い、制御部8の指示
にしたがってディスプレイ等に候補文字群10を表示さ
せる。さらに、この候補文字群10の中の候補文字に略
字である異形文字12が存在する場合には、例えばその
候補文字の下に略字から成る異形文字12を表示する。
なお、異形文字12は、マウス7等によって指定した候
補文字の下にのみ表示させるようにしてもよい。そし
て、オペレータはその表示内容から修正したい異形文字
12をマウス7等によって選択し、これを誤認識部分に
表示する(図8(c)参照)。
【0028】この正字13に対応する略字である異形文
字12は、例えば図9に示すような略字テーブル30と
して記憶しておけばよい。これにより、正字13である
標準の字体から対応する略字を即座に表示させることが
でき、迅速な文字修正を行うことができるようになる。
【0029】次に、本発明の第5実施例を図10〜図1
1に基づいて説明する。図10(a)は帳票1の記入状
態を示す図であり、記入枠11に例えば手書きによって
人名等が漢字で記入されている。また、漢字の記入に際
して、例えば「高」の文字の旧字体である異形文字12
を用いて書く場合がある。このような同音かつ同意で異
形である異形文字12を認識する場合には、図10
(b)に示すように正字13である例えば「高」と誤認
識してディスプレイ等に表示してしまうことがある。
【0030】そこで、これを修正するため第5実施例に
おいては先ず誤認識部分の指定を行い、制御部8の指示
にしたがってディスプレイ等に候補文字群10を表示さ
せる。さらに、この候補文字群10の中の候補文字に旧
字体である異形文字12が存在する場合には、例えばそ
の候補文字の下に旧字体から成る異形文字12を表示す
る。なお、異形文字12は、マウス7等によって指定し
た候補文字の下にのみ表示させるようにしてもよい。そ
して、オペレータはその表示内容から修正したい異形文
字12をマウス7等によって選択し、これを誤認識部分
に表示する(図10(c)参照)。
【0031】この正字13に対応する旧字体である異形
文字12は、例えば図11に示すような旧字体テーブル
40として記憶しておけばよい。これにより、正字13
である標準の字体から対応する旧字体を即座に表示させ
ることができ、迅速な文字修正を行うことができるよう
になる。特に、戸籍等における氏名表示では旧字体をそ
のまま用いる場合があるため、これを正字13に誤認識
してしまった場合において本実施例は有効となる。
【0032】
【発明の効果】以上説明したように、本発明の光学式読
み取り装置における文字修正方法によれ次のような効果
がある。すなわち、ディスプレイ等に表示された認識不
良部分や誤認識部分をマウス等を用いて指定し、その部
分の文字に対応する字体や文字種、区分に応じた辞書を
指定することで、候補文字を限定した的確な修正作業を
行うことができるようになる。これにより、帳票に種々
の文字が混在していても、表示部上におけるマウス等の
操作によってオペレータが容易に文字修正を行うことが
できるようになり、修正作業の大幅な軽減を図ることが
可能となる。
【図面の簡単な説明】
【図1】光学式読み取り装置の構成を示すブロック図で
ある。
【図2】第1実施例を説明する図(その1)である。
【図3】第1実施例を説明する図(その2)であり、
(a)は文字の切り出し状態、(b)は最初の認識後、
(c)は字体の指定、(d)は再認識後を示している。
【図4】第2実施例を説明する図(その1)であり、
(a)は記入状態、(b)は認識後、(c)は後認識部
分の指定を示している。
【図5】第2実施例を説明する図(その2)であり、
(a)は辞書の指定、(b)は再認識による候補文字の
表示、(c)は修正後を示している。
【図6】第3実施例を説明する図(その1)で、(a)
は記入状態、(b)は認識状態と誤認識部分の指定、
(c)は文字種の指定を示している。
【図7】第3実施例を説明する図(その2)で、(a)
は候補文字群の絞り込み、(b)は修正後を示してい
る。
【図8】第4実施例を説明する図で、(a)は記入状
態、(b)は誤認識部分の指定と異形文字の表示、
(c)は修正後を示している。
【図9】略字テーブルを示す図である。
【図10】第5実施例を説明する図で、(a)は記入状
態、(b)は誤認識部分の指定と異形文字の表示、
(c)は修正後を示している。
【図11】旧字体テーブルを示す図である。
【符号の説明】
1 帳票 2 スキャナ部 3 文字切り出し部 4 文字認識部 5 表示部 6 キーボード部 7 マウス 8 制御部 10 候補文字群 11 記入枠
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平5−12483(JP,A) 特開 平5−62008(JP,A) 特開 平6−274680(JP,A) 特開 平7−65112(JP,A) 特開 平1−316891(JP,A) 特開 平3−175593(JP,A) 特開 昭58−189777(JP,A) 特開 昭63−155385(JP,A) 特開 昭62−214486(JP,A) 特開 昭60−7586(JP,A) 特開 昭62−214485(JP,A) 特開 昭60−128578(JP,A) 特開 昭58−137084(JP,A) 特開 昭64−19489(JP,A) 実開 平1−155564(JP,U) (58)調査した分野(Int.Cl.7,DB名) G06K 9/00 - 9/82

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 帳票に記入された種々の文字からの反射
    光を光学式センサにて受光し、その受光信号に基づく文
    字認識を行ってその結果を画面に表示した後、その表示
    内容の修正を行う光学式読み取り装置における文字修正
    方法であって、 前記表示内容に誤認識があった場合にはその誤認識部分
    を画面上で指定し、 次いで、先に指定した前記誤認識部分に対応する文字の
    候補文字群を表示し、その候補文字群の中から候補文字
    が選択された際、その選択された候補文字と対応する
    音かつ同意で異形の文字を表示し、 その表示内容からオペレータの操作によって選択された
    前記同音かつ同意で異形の文字を前記画面上の前記誤認
    識部分に表示することを特徴とする光学式読み取り装置
    における文字修正方法。
  2. 【請求項2】 前記同音かつ同意で異形の文字は、正字
    に対する旧字、略字または俗字であることを特徴とする
    請求項記載の光学式読み取り装置における文字修正方
    法。
JP05517694A 1994-02-28 1994-02-28 光学式読み取り装置における文字修正方法 Expired - Fee Related JP3457376B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP05517694A JP3457376B2 (ja) 1994-02-28 1994-02-28 光学式読み取り装置における文字修正方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP05517694A JP3457376B2 (ja) 1994-02-28 1994-02-28 光学式読み取り装置における文字修正方法

Publications (2)

Publication Number Publication Date
JPH07239901A JPH07239901A (ja) 1995-09-12
JP3457376B2 true JP3457376B2 (ja) 2003-10-14

Family

ID=12991421

Family Applications (1)

Application Number Title Priority Date Filing Date
JP05517694A Expired - Fee Related JP3457376B2 (ja) 1994-02-28 1994-02-28 光学式読み取り装置における文字修正方法

Country Status (1)

Country Link
JP (1) JP3457376B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009251918A (ja) * 2008-04-04 2009-10-29 Hiroaki Matsuda 文字認識装置、文字認識プログラム、及び、文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2012133654A (ja) * 2010-12-22 2012-07-12 Toshiba Corp 文字認識システムおよび文字認識プログラム
JP5284342B2 (ja) * 2010-12-22 2013-09-11 株式会社東芝 文字認識システムおよび文字認識プログラム

Also Published As

Publication number Publication date
JPH07239901A (ja) 1995-09-12

Similar Documents

Publication Publication Date Title
JP3427692B2 (ja) 文字認識方法および文字認識装置
US5717794A (en) Document recognition method and system
US5161245A (en) Pattern recognition system having inter-pattern spacing correction
JPH11120293A (ja) 文字認識/修正方式
JP2000315247A (ja) 文字認識装置
JP3457376B2 (ja) 光学式読み取り装置における文字修正方法
EP0519713B1 (en) Character input method and apparatus
JPH02255964A (ja) 文書変更部分の自動識別装置
JP2002063197A (ja) 検索装置、記録媒体およびプログラム
JPS63146187A (ja) 文字認識装置
EP0692768A2 (en) Full text storage and retrieval in image at OCR and code speed
JPH06223221A (ja) 文字認識装置
JP2887823B2 (ja) 文書認識装置
JPH06333083A (ja) 光学式文字読取装置
JPH0916709A (ja) 文字認識表示システムおよび方法
JPS60217483A (ja) 文字認識装置
JP2976990B2 (ja) 文字認識装置
JPH08297718A (ja) 文字切り出し装置及び文字認識装置
JPH04293185A (ja) ファイリング装置
JP2931485B2 (ja) 文字切出し装置及び方法
JPH053631B2 (ja)
JP2915417B2 (ja) 文字認識結果表示方法および装置
JP3310063B2 (ja) 文書処理装置
JPH06290308A (ja) 文字認識装置
JPH0546803A (ja) 認識結果の出力方法

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070801

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080801

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090801

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees