JPH02183387A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH02183387A
JPH02183387A JP1003571A JP357189A JPH02183387A JP H02183387 A JPH02183387 A JP H02183387A JP 1003571 A JP1003571 A JP 1003571A JP 357189 A JP357189 A JP 357189A JP H02183387 A JPH02183387 A JP H02183387A
Authority
JP
Japan
Prior art keywords
characters
recognition
character
isomorphic
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1003571A
Other languages
English (en)
Inventor
Kozo Tomono
伴野 浩三
Keiji Kobayashi
啓二 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP1003571A priority Critical patent/JPH02183387A/ja
Publication of JPH02183387A publication Critical patent/JPH02183387A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] この発明は、多くの字種を認識する文字認識装置、特に
認識不能文字及び誤読文字を容易に修正できる文字認識
装置に関するものである。
[従来の技術] 従来、この種の装置としては例えば、「三菱OCRM2
483−N概説書」に示されたようなものがあった。第
5図はこのような従来の文字認識装置の構成を示すブロ
ック図であり、(1)は帳票、(2)は走査手段である
。走査手段(2)は、帳票(1)を走査し光電変換する
ことにより得られる入力文字パターン信号を認識手段(
3)に出力する。(4)は認識対象文字の基準文字パタ
ーン情報を格納した認識辞書であり、認識手段(3)に
認識対象文字の基準文字パータン情報を出力する。入力
文字パターン信号と認識辞書(4)内の基準文字パター
ン情報とを比較することにより得られる認識手段(3)
の出力は、制御手段(5)に入力される。(6)は認識
結果の修正を行うためのデータを制御手段(5)に入力
するための入力手段、(7)は、制御手段(5)からの
指令に基づき認識結果及び認識候補文字を表示する表示
手段である。
次に、上記構成の従来の装置による文字認識動作につい
て、第6図に示すフローチト一トに基づき説明する。
まずステップ(101)においては、帳票(1)上の文
字を走査手段(2)で走査し光電変換することにより入
力文字パターン信号を得て、これを認識手段(3)に送
り、文字の読み込み動作を完了する。次いでステップ(
102)に進み、認識手段(3)で入力文字パターン信
号と認識辞書(4)内の基準文字パターン情報とを比較
することにより入力文字パターンの認識を行い、この認
識結果および認識候補文字を制御手段(5)に送った後
、ステップ(103)に進む。ステップ(103)では
、表示手段(7)が、制御手段(5)からの指令に基づ
き入力文字パターンの認識結果を表示する。続くステッ
プ(104)では、オペレータが、表示手段(7)に表
示された認識結果がiELい文字であるかどうかを判定
する。ここで、判定結果がYESで認識結果が正しい場
合、ステップ(107)へ進むが、判定結果がNoで、
認識結果が正しくない場合、ステップ(105)に進み
、認識候補文字を表示手段(7)に表示し、次いでステ
ップ(106)で、オペレータが入力手段(6)を用い
て正しい文字を選択し入力する。
ところで、認識対象字種が漢字、ひらがな、カタカナ、
記号等と多種にわたる場合、字形が全く同じである複数
の文字(以下、同形文字という)が含まれることがあり
、これらを、前後の文字を含めた単語、文法情報を用い
ず、単一の文字パターン情報だけから正しく認識するこ
とは不可能である。
従って、文字認識装置においても、このような同形文字
を認識すると、認識不能あるいは誤読となる確率が高く
、このような場合認識候補文字を用いて修正入力するこ
とになる。
同形文字の例としては、“力” (漢字)と“力2(カ
タカナ)、“工゛ (漢字)と“工” (カタカナ)、
 = (いち)と“−(長音記号)と(ハイフン)と“
−(負号)、“へ” (ひらがな)と“へ“ (カタカナ)などがある。
第7図は、1カ” (漢字)の認識結果(9)が認識不
能(図中では◆)となり、入力文字パターン(10)及
び認識候補文字(11)の“力゛(漢字)、“力“ (
カタカナ)及び“コ”が表示手段(7)上に表示された
状態を示している。この場合、認識結果及び認識候補文
字の表示フォントに微妙な違いがあるとは言え、オペレ
ータがこれをすべて識別して正しく選択入力することは
不可能ではないにしても高度の熟練を必要とする。
[発明が解決しようとする課題] 従来の課題 以上述べた従来の文字認識装置においては、認識対象文
字の中に同形文字が含まれることがあり、認識不能ある
いは誤読となる確率が高く、また、認識不能となった場
合、オペレータが表示フォントの違いから同形文字の識
別をしなければならないので、その識別処理のための細
心の注意を払う必要があり、極度の疲労を生じ、誤入力
を生じやすいという問題点があった。
従って、上記問題点を解消しなければならないという課
題がある。
発明の目的 この発明は上記課題を解決するためになされたもので、
文字が正しく認識される確率を高め、認識結果の修正回
数を減少させるとともに、修正作業の操作性を改善し、
オペレータの疲労を軽減し、誤入力を減少させることが
できる文字認識装置を得ることを1」的とする。
[課題を解決するための手段] この発明に係る文字認識装置は、帳票に記録された文字
を走査して入力文字パターン信号を出力する走査手段と
、認識対象文字の基準文字パターン情報を格納した認識
辞書と、上記走査手段から出力される入力文字パターン
信号と」二記基準文字パターン情報とを比較して文字を
認識する認識手段と、同形文字名を格納する同形文字格
納テーブルと、上記認識手段による認識結果および認識
候補文字を編集し出力する制御手段と、上記認識結果及
び認識候補文字を表示する表示手段と、上記認識結果の
修正入力及び同形文字名の入力を行う入力手段とを備え
ている。
上記制御手段は、上記同形文字格納テーブルに格納され
た同形文字名の情報により、同形文字名に対応する上記
認讃辞書内の基準文字パターンを認識対象から除外する
ように指定する。また、上記制御手段は、上記認識手段
から送られる認識候補文字に上記同形文字格納テーブル
の同形文字名の情報を付加して上記表示手段に表示さけ
るように構成されている。
[作用] この発明における文字認識装置は、同形文字格納テーブ
ルに格納された同形文字の各組の先頭以外の文字を認識
対象文字から除外して認識手段で認識すると共に、ある
同形文字の組の先頭文字が認識候補文字に含まれる場合
、その組に属する他のすべての文字を認識候補文字に加
えて表示手段に表示することにより、表示手段上でフォ
ントだけからでは区別しにくい同形文字を容易に識別で
きるようにし、オペレータによる修正作業の操作性を軽
減する。
[実施例] 以下、この発明の実施例を図について説明する。
第1図はこの発明の一実施例のブロック図である。(1
1)は帳票、(12)は走査手段であり、走査手段(1
2)は、帳票(11)上を走査することにより帳票(1
1)上の文字を光電変換し、入力文字パターン信号を得
て、これを認識手段(13)に出力する。
(14)は認識対象文字の基準パターンを格納した認識
辞書であり、認識対象文字の基準文字パターン情報を必
要に応じ認識手段(13)に出力する。入力文字パター
ン信号と認識辞書(4)内の基準文字パターン情報とを
比較することにより得られる認識手段(13)の出力は
、制御手段(15)に入力される。(16)は認識結果
の修正を行うためのデータを制御手段(15)に入力す
るための入力手段、(17)は、制御手段(15)に入
力するための入力手段、(17)は、制御手段(15)
からの指令に基づき、認識手段(13)における認識結
果及び認識候補文字を表示する表示手段である。
制御手段(15)には同形文字の組を格納する同形文字
格納テーブル(18)が付設されている。
第2図はこのような同形文字格納テーブル(18)の−
例であり、“力″(漢字)と“力″ (カタカナ)、“
工” (漢字)と“工” (カタカナ)、(いち)と“
−(長音記号)と“ (ハイフン)と“−(負号)がそれぞれ同形文字の組と
して格納されていることを示す。
次に、上記実施例の文字認識動作について、第3図に示
すフローチャートにより説明する。
まずステップ(201)では、オペレータが入力手段(
16)から制御手段(15)に同形文字の組を入力する
次にステップ(202)に進み、帳票(11)上の文字
を走査手段(12)で走査、光電変換し、入力文字パー
タン信号を得て、認識手段(13)にこの入力文字パタ
ーン信号を送り入力文字パタンの読込みを完了する。
次いでステップ(203)において、認識手段(13)
により入力文字パターン信号と認識辞書(14)内の基
準文字パターン情報とを比較することにより認識を行い
、その認識結果及び認識候補文字を制御手段(15)に
送る。
但し、上記認識のための比較は、同形文字の組の中の文
字のうち認識対象から除外する文字に対しては行わない
。次にステップ(204)に進み、制御手段(15)が
表示手段(17)に認識結果を表示させる指令を出し、
認識結果か表示手段(17)上に表示される。その後、
ステップ(205)で認識結果か正しい文字であるかど
うかをオペレータが調べ、正しくなければ、ステップ(
20B)に進み、入力手段(16)により、認識候補文
字の表示を指示する。このとき制御手段(15)は、認
識手段(13)から送られてきた認識候補文字を表示手
段(17)に表示する。また、同形文字テーブル(18
)のキー文字が認識候補文字に含まれるときは、その文
字と同じ組に属する同形文字を同形文字テーブル(18
)から読み込み、キー文字の下に並べて表示する。最後
にステップ(207)でオペレータが入力手段(16)
を用いて正しい文字を選択入力し、ステップ(208)
ですべての文字の認識を終了したか否かを判断し、終了
の場合、全1−程を終了し、また、終了していない場合
はステップ(205)の直前に戻る。またステップ(2
05)で認識結果が正しい場合は、ステップ(208)
に進むことになる。 第4図は、上記実施例における表
示手段(17)上の表示の一例を示している。例えば、
第4図の入力文字パターン(2o)を認識させると、ス
テップ(203)で認識手段(13)により認識結果の
“認識不能”及び認識候補文字の“力” (漢字)と“
コ”か制御手段(15)に送られ、ステップ(204)
で認識結果(19)(図中では◆)か表示手段(17)
に表示される。
ステップ(206)で制御手段(15)は同形文字テー
ブル(18)を参照し、“力” (漢字)(18a)を
キーとして、“力″ (カタカナ)(18b)を読み込
み、表示手段(17)に“力”(漢字)(21)、“コ
” (21)及び“力”(カタカナ)(22)を送り表
示する。表示手段(17)では、同形文字はキーとなる
文字の下に並べて表示されるので、認識手段(13)か
らの認識候補文字か表示の時点で減ることはない。また
、同形文字は、常に同形文字テーブル(18)内での格
納順に表示される。
通常、オペレータは同形文字テーブル(18)内での同
形文字の並び順を予め知っているため、何ら迷うことな
く容易に認識候補文字の中から所望の文字を選択し、入
力することができる。また、同形文字テーブルに格納す
る際に、出現頻度の高い文字をキーとすることにより、
正しく認識される確率が高くなるため、認識結果の修正
回数を減少させることかできる。
なお、上記実施例では、同形文字の並び順をオペレータ
が予め知っていると仮定して説明したが、この発明にお
いては、同形文字格納テーブルの内容を必要に応じて表
示し、同形文字の並び順を確認できるようにしてもよい
。このとき、同形文字テーブル内の文字には、漢字、カ
タカナ等の属性あるいは音訓等を付加して表示するので
オペレタにとって識別し易くすることができる。
[発明の効果コ この発明は以上説明した通り、制御手段が、同形文字格
納テーブルに格納された同形文字名の情報により、同形
文字名に対応する認識辞書内の基準文字パターンを認識
対象から除外するように指定するとともに、認識手段か
ら送られる認識候補文字に上記同形文字格納テーブルの
同形文字名の情報を付加して表示手段に表示させ、認識
候補文字を表示する際の同形文字の並び順が一定となる
ようにした構成により、文字が正しく認識される確率を
高め、認識結果の修正回数を減少させ、かつ、識別しに
くい同形文字を容易に修正することができるようにし、
修正作業の操作性を改善し、オペレータの疲労を軽減す
るとともに、誤入力を減少させるという顕著な効果を有
する。
【図面の簡単な説明】
第1図はこの発明の一実施例のブロック図、第2図は第
1図に示す実施例に用いられる同形文字格納テーブルの
一例を示す説明図、第3図は第1図に示す実施例の動作
を説明するだめのフローチャート、第4図はこの発明に
よる認識結果を修正するときの画面表示の一例を示す説
明図、第5図は従来の文字認識装置のブロック図、第6
図は第5図に示す従来の装置の動作を示すフローチャト
、第7図は従来の装置による認識結果を修正するときの
画面表示の一例を示す説明図である。 図において、(11)は帳票、(12)は走査手段、(
13)は認識手段、(14)は認識辞書、(15)は制
御手段、(16)は入力手段、(17)は表示手段、(
18)は同形文字格納テーブルである。 なお、 図中、 同一符号は同一、 又は相当部分を 示す。

Claims (1)

    【特許請求の範囲】
  1.  帳票に記録された文字を走査して入力文字パターン信
    号を出力する走査手段と、認識対象文字の基準文字パタ
    ーン情報を格納した認識辞書と、上記走査手段から出力
    される入力文字パターン信号と上記基準文字パターン情
    報とを比較して文字を認識する認識手段と、同形文字名
    を格納する同形文字格納テーブルと、上記認識手段によ
    る認識結果および認識候補文字を編集し出力する制御手
    段と、上記認識結果及び認識候補文字を表示する表示手
    段と、上記認識結果の修正入力及び同形文字名の入力を
    行う入力手段とを備え、上記制御手段は、上記同形文字
    格納テーブルに格納された同形文字名の情報により、同
    形文字名に対応する上記認識辞書内の基準文字パターン
    を認識対象から除外するように指定するとともに、上記
    認識手段から送られる認識候補文字に上記同形文字格納
    テーブルの同形文字名の情報を付加して上記表示手段に
    表示させるように構成されたことを特徴とする文字認識
    装置。
JP1003571A 1989-01-10 1989-01-10 文字認識装置 Pending JPH02183387A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1003571A JPH02183387A (ja) 1989-01-10 1989-01-10 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1003571A JPH02183387A (ja) 1989-01-10 1989-01-10 文字認識装置

Publications (1)

Publication Number Publication Date
JPH02183387A true JPH02183387A (ja) 1990-07-17

Family

ID=11561133

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1003571A Pending JPH02183387A (ja) 1989-01-10 1989-01-10 文字認識装置

Country Status (1)

Country Link
JP (1) JPH02183387A (ja)

Similar Documents

Publication Publication Date Title
USRE36581E (en) Character reader and recognizer with a specialized editing function
US5022081A (en) Information recognition system
US5233672A (en) Character reader and recognizer with a specialized editing function
JPH02183387A (ja) 文字認識装置
JPH08221558A (ja) 文書ファイリング方法及び装置
JP3221968B2 (ja) 文字認識装置
JPH0157837B2 (ja)
JPH06223221A (ja) 文字認識装置
JPH06333083A (ja) 光学式文字読取装置
JPH07249098A (ja) 情報処理装置および情報処理方法
JPH09114918A (ja) 光学式文字読取装置
JPH0388086A (ja) 文書読取装置
JPH07239901A (ja) 光学式読み取り装置における文字修正方法
JP2687902B2 (ja) 文書画像認識装置
JP3221969B2 (ja) 文字認識装置
JPH06251187A (ja) 文字認識誤り修正方法及び装置
JPS61133487A (ja) 文字認識装置
JPH05120471A (ja) 文字認識装置
JPS61198383A (ja) 文字修正装置
JPH03244093A (ja) 文字認識装置
JPH05120472A (ja) 文字認識装置
JPS63208180A (ja) 文字認識装置
JPS61226883A (ja) 文字認識装置
JPH0581467A (ja) 画像処理方法及び装置
JPH04293185A (ja) ファイリング装置