JPH0458381A - 光学的文字読取装置 - Google Patents

光学的文字読取装置

Info

Publication number
JPH0458381A
JPH0458381A JP2168410A JP16841090A JPH0458381A JP H0458381 A JPH0458381 A JP H0458381A JP 2168410 A JP2168410 A JP 2168410A JP 16841090 A JP16841090 A JP 16841090A JP H0458381 A JPH0458381 A JP H0458381A
Authority
JP
Japan
Prior art keywords
character
rejected
kanji
candidate
kana
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2168410A
Other languages
English (en)
Inventor
Koichi Sekiguchi
関口 康一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2168410A priority Critical patent/JPH0458381A/ja
Publication of JPH0458381A publication Critical patent/JPH0458381A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、文字認識処理によって得られた結果に対して
、修正作業を行なうことが可能な光学的文字読取装置に
関する。
(従来の技術) 従来、帳票等に記入された漢字の読取りを行なう光学的
文字読取装置においては、リジェクトが発生した場合、
そのリジェクトされた文字のイメージパターン(リジェ
クトパターン)がCRT等に表示され、文字修正を行な
う際の参考として供される。また、リジェクトパターン
と同時に、文字認識処理の結果を基に複数個の候補文字
が表示される。この候補文字は、リジェクトパターンを
参考にして選択され、リジェクトされた文字と置き換え
られる。
しかしながら、例えば文字認識処理の前段において行わ
れる文字パターンの切出し処理において、正しく1文字
毎に文字パターンが切出されなかった場合では、リジェ
クトパターンからでは文字を判別できず、かつ候補文字
が得られないことがある。このような場合、リジェクト
された文字の前後の認識結果を参考にしてリジェクトさ
れた文字の判別を行ない、キーボード等から漢字の「読
み」を入力して、かな漢字変換によって文字の置き換え
を行なっている。また、オペレータが読めない文字(漢
字)がリジェクトした場合(「読み」が入力できない場
合)には、例えば「漢和辞典」等を用いて「読み」を調
べて入力するか、リジェクトされたりジエクトパターン
をそのまま入力している。
(発明が解決しようとする課題) このように、文字認識処理の結果、リジェクトが発生し
、リジェクトパターンからでは文字を判別できず、かつ
候補文字が表示されない場合には、キーボード等から漢
字の「読み」を入力して、リジェクト修正を行なわなけ
ればならなかった。
このため、リジェクトされた漢字の「読み」が分らない
場合では、わざわざ「漢和辞典」等を用いて「読み」を
調べて入力したり、またはりジエクトパターンのまま入
力して後で修正しなければならなかった。このように、
リジェクト文字を修正するための作業が繁雑となり、ま
た効率が悪いという問題があった。
本発明は前記のような点に鑑みてなされたもので、リジ
ェクトした文字の修正を容易、かつ効率的に行なうこと
が可能な光学的文字読取装置を提供することを目的とす
る。
[発明の構成] (課題を解決するための手段) 本発明は、文字認識処理によってリジェクトされた文字
が存在する場合に、この文字を修正して文字読取り結果
とする光学的文字読取装置において、リジェクトされた
文字を含む文字認識処理の結果得られた複数の文字を基
にして、前記リジェクトされた文字を置換えて得られる
意味的に正しい文字列を求める照合判別手段と、前記照
合判別部によって得られた前記文字列中の漢字をかなに
変換して前記リジェクトされた文字に対する読み候補を
求める漢字かな変換手段と、前記漢字かな変換手段によ
って得られた前記読み候補を表示する読み候補表示手段
と、前記読み候補表示手段によって表示された読み候補
中の任意に指定された読み候補を漢字に変換するかな漢
字変換手段と、前記漢字変換手段によって得られた漢字
を用いてリジェクトされた文字を修正するりジエクト修
正手段とを具備して構成するものである。
(作用) このような構成によれば、文字認識処理によって特にリ
ジェクトされた文字に対応する候補文字が得られない場
合でも、リジェクトされた文字を含む文字認識処理の結
果得られた複数の文字(リジェクト文字の前後の文字)
を基にして、リジェクト文字を修正して得られる文字列
(候補文字列)が求められる。また、得られた文字列が
、かなに変換され表示されるので、正しい文字(漢字)
が何であるかの判別が容易になる。
(実施例) 以下、図面を参照して本発明の一実施例を説明する。第
1図は同実施例に係わる光学的文字読取装置の構成を示
すブロック図である。同図において、lOは制御部であ
り、装置全体の制御を司どるものである。制御部10は
、図示せぬ文字認識処理部によって得られる文字認識結
果について修正処理を行なうための修正処理部12を構
成する各部の動作を制御する。また、制御部loは、マ
ンマシンインターフェイスであるCRT等により構成さ
れる表示部14、及びキーボードI6についての制御を
行なう。
修正処理部12には、照合判別部20、漢字−かな変換
部22、かな漢字変換部24、リジェクト修正部26、
及び辞書部28が設けられている。照合判別部20は、
文字認識ll5(図示せず)からの文字認識結果を入力
し、リジェクトされた文字について候補文字が得られな
い場合に、前後の文字を基にして候補文字列を求めるも
のである(照合判別処理)。
候補文字列は、リジェクトされた文字をある文字に置き
換えて得られる、正しい単語、または文章が後述する辞
書部2B(候補文字列選択辞書)から選択されるもので
ある。漢字−かな変換部22は、照合判別部20によっ
て得られた候補文字(漢字)を含めて、必要に応じて前
後の文字をかなに変換し、「読み候補」を求めるもので
ある。かな漢字変換部24は、漢字婦かな変換部22に
よって得られた「読み候補」 (かな)、またはキーボ
ード16から入力された文字情報(「読み」)を漢字に
変換するものである。リジェクト修正部2Bは、かな漢
字変換部24によって得られた漢字と、文字認識結果中
のリジェクト文字とを置き換えて、リジェクトを修正す
るものである。辞書部28には、照合判別部20におけ
る処理に用いられる候補文字列選択辞書、漢字→かな変
換部22における処理に用いられる漢字かな変換辞書、
及びかな漢字変換部24における処理に用いられるかな
漢字変換辞書が予め格納されている。
次に、同実施例の動作について、第2図に示すフローチ
ャートを参照しながら説明する。
まず、読取り処理が開始されると(ステップS1)、ス
キャナ装置(図示せず)によって、文字読取り処理の対
象とする帳票のイメージが検出される。文字認識処理部
(図示せず)は、この帳票イメージから、1文字分毎に
文字パターンの切出しを行なう。そして、各文字パター
ンについて、文字認識処理用の辞書に基づいて文字認識
処理を行なう。この文字認識処理部によって得られた文
字認識処理結果は、修正処理部12に転送される。
文字認識処理の結果は、表示部14に表示される。
ここで、文字認識処理において、辞書との類似度が所定
の値以下となったような場合、その文字パターンはりジ
エクト文字とされ、その旨を示すように表示される。
リジェクトが発生しながった場合には(ステップS2)
、修正処理が実行されず、後続する処理があればその処
理を実行する(ステップS3)。
一方、リジェクトが発生した場合(ステップS2)、そ
の文字を指定することによって、リジェクトパターンが
表示される。またリジェクトパターンと共に、文字認識
処理によっである程度の類似度値が得られていればリジ
ェクト文字に対する候補文字が表示部14に表示される
(ステップS4)。ここで、候補文字が表示された場合
には(複数の場合もある)、キーボード1Gからの指示
によって、リジェクト文字と置き換えるべき文字を選択
することができる。候補文字の中に正しい文字が存在し
、オペレータから候補文字選択の指示が入力されると(
ステップS5)、制御部10は、リジェクト修正部26
に対してリジェクト修正を指示する。リジェクト修正部
26は、オペレータにより指示された候補文字と、リジ
ェクト文字とを置き換えてリジェクト修正を行なう(ス
テップS6)。リジェクト修正が終了するとステップS
3の処理に移る。
なお、ステップS5においては、候補文字の選択を行な
うものとしたが、キーボード1Bより文字情報(「読み
」)を入力することによってリジェクト修正を行なうこ
とができる。この場合、キーボード16から「読み」が
入力されると、制御部I6は、かな漢字変換部24に転
送する。かな漢字変換部24では、入力された「読み」
について、辞書部28に格納されたかな漢字変換辞書を
用いてかな漢字変換を行なう。これによって得られた漢
字は、リジェクト修正部26に転送される。リジェクト
修正部2Bは、この漢字とリジェクト文字との置き換え
を行ないリジェクト修正を行なう。
一方、ステップS4において、文字認識処理の結果から
候補文字が得られず、第3図に示すように、リジェクト
パターンのみが表示された場合には次のようにして処理
が実行される。ここで、照合判別処理が起動されない場
合(ステップS7)、すなわち表示されたリジェクトパ
ターンから文字の判別が可能でありオペレータによる文
字情報(「読み」)が入力された場合には、ステップS
5の処理に移る。これより、入力された「読み」を基に
して、前記同様にしてリジェクト修正を行なう。
ステップS7において、照合判別処理が起動された場合
、照合判別部20は、リジェクト文字の前後の文字を含
む単語、または文章を参照して候補文字列を求める(ス
テップS8)。すなわち、照合判別部20は、リジェク
ト文字をもとにして意味的に正しい単語、または文章と
なるように文字認識処理の結果から文字列を取り出す。
そして、辞書部28に格納された候補文字列選択辞書中
の、取出された文字列に対応する辞書情報(文字数が同
一のもの)との照合を行ない、リジェクト文字を除く他
の文字が一致する単語、または文章(候補文字列)を求
める。この時、複数の候補文字列が得られるようにする
。なお、照合の対象となる単語1文章としては、熟語や
文節毎に区切って得られる文字列とする。この際、例え
ば初めに2文字の熟語によって照合を行なった結果、候
補文字列が得られなかったり、または候補を絞ることが
できないような場合には、照合の対象となる単語。
文章の文字数を変更して、再度照合を行なうようにして
も良い。照合判別部20において候補文字列が得られる
と、その結果が、漢字−かな変換部22に転送される。
漢字−かな変換部22は、候補文字列中の漢字をかなに
変換し、「読み候補」を生成する(ステップS9)。複
数の候補文字列が、かなに変換されると、第4図に示す
ように、表示部14に表示される(ステップ510)。
第4図においては、リジェクトパターンと共に、複数の
「読み候補」が表示される。また、「読み候補」とその
前後の(第4図では後続する)文章を表示して、前後の
文章を参考にして「読み候補」を選択できるようにする
。この文章中では、「読み候補」に対応する部分につい
ては、例えば他の文字と異なる属性によって表示し、判
別し易くする。
ここで表示された「読み候補」から、何れかが選択され
ると(ステップ511)その「読み」がかな漢字変換部
24に転送される。かな漢字変換部24は、辞書部28
に格納されたかな漢字変換辞書を用いて「読み」を漢字
に変換する(ステップ512)。
かな漢字変換部24において得られた漢字はリジェクト
修正部26に転送され、リジェクト修正(ステップS6
)に供される。リジェクト修正が終了するとステップS
3の処理に移る。
このようにして、文字認識処理の結果、リジェクトが発
生し、候補文字が得られず、かつ表示されたリジェクト
パターンから文字を判別することができない場合であっ
ても、リジェクト文字の前後の文字を基にして得られる
候補文字列から選択してリジェクト修正を実行すること
ができる。このため、「漢和辞典」を用いて「読み」を
調べるという作業や、リジェクトパターンのまま入力し
て後で修正するという作業が不要となる。従って、リジ
ェクト修正作業を容易、かつ効率的に行なうことができ
る。
[発明の効果] 以上のように本発明によれば、リジェクトされた文字に
ついての候補文字が表示されず、またリジェクトパター
ンから文字を判別できないような場合であっても、リジ
ェクト文字の前後の文字を基にして得られた候補文字列
の読みである「読み候補」が表示され、これを選択する
ことでリジェクト修正を行なうことができる。従って、
リジェクトした文字の修正を容易、かつ効率的に行なう
ことが可能となるものである。
【図面の簡単な説明】
第1図は本発明の一実施例に係わる光学的文字読取装置
におけるリジェクト修正を行なう機能部(リジェクト修
正部)の構成を示すブロック図、第2図は同実施例にお
けるリジェクト修正処理の処理手順を示すフローチャー
ト、第3図及び第4図はりジエクト修正処理の処理途中
における表示例を示す図である。 10・・・制御部、12・・・修正処理部、14・・・
表示部、16・・・キーボード、20・・・照合判別部
、22・・・漢字→かな変換部、24・・・かな漢字変
換部、26・・・リジェクト修正部、28・・・辞書部
。 出願人代理人 弁理士 鈴江武彦 12修正処理部 f 第 図 第 図 第 図

Claims (1)

  1. 【特許請求の範囲】 文字認識処理によってリジェクトされた文字が存在する
    場合に、この文字を修正して文字読取り結果とする光学
    的文字読取装置において、リジェクトされた文字を含む
    文字認識処理の結果得られた複数の文字を基にして、前
    記リジェクトされた文字を置換えて得られる意味的に正
    しい文字列を求める照合判別手段と、 前記照合判別部によって得られた前記文字列中の漢字を
    かなに変換して前記リジェクトされた文字に対する読み
    候補を求める漢字かな変換手段と、前記漢字かな変換手
    段によって得られた前記読み候補を表示する読み候補表
    示手段と、 前記読み候補表示手段によって表示された読み候補中の
    任意に指定された読み候補を漢字に変換するかな漢字変
    換手段と、 前記かな漢字変換手段によって得られた漢字を用いてリ
    ジェクトされた文字を修正するリジェクト修正手段と、 を具備したことを特徴とする光学的文字読取装置。
JP2168410A 1990-06-28 1990-06-28 光学的文字読取装置 Pending JPH0458381A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2168410A JPH0458381A (ja) 1990-06-28 1990-06-28 光学的文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2168410A JPH0458381A (ja) 1990-06-28 1990-06-28 光学的文字読取装置

Publications (1)

Publication Number Publication Date
JPH0458381A true JPH0458381A (ja) 1992-02-25

Family

ID=15867608

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2168410A Pending JPH0458381A (ja) 1990-06-28 1990-06-28 光学的文字読取装置

Country Status (1)

Country Link
JP (1) JPH0458381A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007203518A (ja) * 2006-01-31 2007-08-16 King Jim Co Ltd 綴じ具及びそれを備えたファイリング用具

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007203518A (ja) * 2006-01-31 2007-08-16 King Jim Co Ltd 綴じ具及びそれを備えたファイリング用具

Similar Documents

Publication Publication Date Title
JP2726568B2 (ja) 文字認識方法及び装置
JPH11194793A (ja) 音声ワープロ
JPH0458381A (ja) 光学的文字読取装置
JP3274014B2 (ja) 文字認識装置および文字認識方法
KR102550868B1 (ko) 교원 업적 검증 시스템
JP3548372B2 (ja) 文字認識装置
JPH11120294A (ja) 文字認識装置および媒体
JPH0256086A (ja) 文字認識の後処理方法
JPH04232997A (ja) 音声認識装置における認識結果表示方式
JPH06333083A (ja) 光学式文字読取装置
JPH07152754A (ja) 文章作成補助機能を持つ文章作成装置
JPH01114976A (ja) 文書処理装置の辞書構造
JPH0290384A (ja) 文字認識装置の後処理方式
CN113553832A (zh) 文字处理方法和装置、电子设备以及计算机可读存储介质
JPH0520420A (ja) 図形処理装置
JPS62190571A (ja) 文字選択方式
JPH05298495A (ja) 文字認識装置と誤認識文字修正方法並びに欧文文書処理装置
JPH10301597A (ja) 音声認識装置
JPH0682366B2 (ja) 文字列訂正方式
JPS63150788A (ja) 文字認識装置
JPH07334624A (ja) 文字認識装置
JPH01114973A (ja) 文書作成・校正支援装置
JPH04365166A (ja) 文章検査装置
JPH03242755A (ja) カタカナ単語誤り検出訂正装置
JPH0728956A (ja) 誤読修正支援方法