JP2874815B2 - 日本語文字読取装置 - Google Patents
日本語文字読取装置Info
- Publication number
- JP2874815B2 JP2874815B2 JP4149258A JP14925892A JP2874815B2 JP 2874815 B2 JP2874815 B2 JP 2874815B2 JP 4149258 A JP4149258 A JP 4149258A JP 14925892 A JP14925892 A JP 14925892A JP 2874815 B2 JP2874815 B2 JP 2874815B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- candidate
- unit
- correction
- characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Character Discrimination (AREA)
- Document Processing Apparatus (AREA)
Description
【0001】
【産業上の利用分野】本発明は、日本語による文字を光
学的に読み取る日本語文字読取装置に関するものであ
る。
学的に読み取る日本語文字読取装置に関するものであ
る。
【0002】
【従来の技術】近年、日本語を他の言語に翻訳する機械
翻訳システムにおける日本語入力手段として、また、日
本語による文書データをデータベース等に入力する際の
データ入力手段として、日本語による文字を光学的に読
み取る日本語文字読取装置の商品化が盛んに行われてい
る。
翻訳システムにおける日本語入力手段として、また、日
本語による文書データをデータベース等に入力する際の
データ入力手段として、日本語による文字を光学的に読
み取る日本語文字読取装置の商品化が盛んに行われてい
る。
【0003】このような日本語文字読取装置では、認識
率を高めるために種々の工夫がなされてきたが、読み取
り対象の文字として、手書き文字が含まれたり、あるい
は汚れた書面等が含まれる場合には、認識率を100%
とすることは技術的に非常に困難である。
率を高めるために種々の工夫がなされてきたが、読み取
り対象の文字として、手書き文字が含まれたり、あるい
は汚れた書面等が含まれる場合には、認識率を100%
とすることは技術的に非常に困難である。
【0004】従って、認識結果が誤っていた場合に、そ
の誤りを簡単な操作で修正することのできる修正機能を
装備することが、日本語文字読取装置としての全体的な
性能を向上させるための重要なポイントとなっている。
の誤りを簡単な操作で修正することのできる修正機能を
装備することが、日本語文字読取装置としての全体的な
性能を向上させるための重要なポイントとなっている。
【0005】従来の場合、認識結果を修正する方式とし
ては、例えば、認識した文字候補の全てを操作者に提示
し、操作者がマウスなどで選択することによって認識結
果を修正するようにしたものがある。
ては、例えば、認識した文字候補の全てを操作者に提示
し、操作者がマウスなどで選択することによって認識結
果を修正するようにしたものがある。
【0006】また、装置の選出した文字候補の中に正解
文字がない場合に備えて、操作者がキーボードから文字
コードを入力すると、その文字コードに対する文字に修
正する機能を装備したもの、あるいは、操作者に文字の
読みがなを入力させてカナ漢字変換によって正解文字を
得るようにしたもの等も開発されている。
文字がない場合に備えて、操作者がキーボードから文字
コードを入力すると、その文字コードに対する文字に修
正する機能を装備したもの、あるいは、操作者に文字の
読みがなを入力させてカナ漢字変換によって正解文字を
得るようにしたもの等も開発されている。
【0007】
【発明が解決しようとする課題】ところが、例えば、日
本語に不慣れな外国人等が日本語文字読取装置を使用す
るような場合、従来の装置では、装置の認識結果が正し
いか否かは、操作者自身が原文における文字と装置の認
識した文字とを1文字ずつ照合することによって確認し
なければならず、膨大な時間を費やすとともに、操作者
に多大な負担を強いるという問題があった。
本語に不慣れな外国人等が日本語文字読取装置を使用す
るような場合、従来の装置では、装置の認識結果が正し
いか否かは、操作者自身が原文における文字と装置の認
識した文字とを1文字ずつ照合することによって確認し
なければならず、膨大な時間を費やすとともに、操作者
に多大な負担を強いるという問題があった。
【0008】また、装置の選んだ文字候補の中に正解文
字が無かった場合、操作者が漢字表などを調べて正解文
字の文字コードを入力するという従来の方式も、操作者
にかかる負担が大きく、さらに、作業性が悪いという問
題があり、改善が望まれていた。
字が無かった場合、操作者が漢字表などを調べて正解文
字の文字コードを入力するという従来の方式も、操作者
にかかる負担が大きく、さらに、作業性が悪いという問
題があり、改善が望まれていた。
【0009】また、操作者に読みがなを入力させてカナ
漢字変換によって正解文字を得るという方式は、操作者
が日本語に不慣れな外国人等の場合には、利用価値が乏
しい。
漢字変換によって正解文字を得るという方式は、操作者
が日本語に不慣れな外国人等の場合には、利用価値が乏
しい。
【0010】本発明は前記事情に鑑みてなされたもの
で、操作者が1文字ずつ原文と照合せずとも修正の必要
がある文字を容易に知ることができて、装置の認識結果
が正しいか否かの確認を迅速かつ容易にすることのでき
る日本語文字読取装置を提供すること、および、装置の
選出した文字候補の中に正解文字が無い場合に、カナ漢
字変換等に頼らずに容易に正解文字を指示することので
きる日本語文字読取装置を提供することを目的とする。
で、操作者が1文字ずつ原文と照合せずとも修正の必要
がある文字を容易に知ることができて、装置の認識結果
が正しいか否かの確認を迅速かつ容易にすることのでき
る日本語文字読取装置を提供すること、および、装置の
選出した文字候補の中に正解文字が無い場合に、カナ漢
字変換等に頼らずに容易に正解文字を指示することので
きる日本語文字読取装置を提供することを目的とする。
【0011】
【0012】
【0013】
【課題を解決するための手段】 請求項1に記載の日本語
文字読取装置は、日本語による文字を光学的に読み取る
もので、文字を光学的に読み取ってイメージデータに変
換する読取部と、文字パターンおよび文字パターンの構
成要素の情報を格納した文字パターン辞書と、単語の構
成文字および品詞および活用法の情報を格納した単語辞
書と、前記読取部から送られたイメージデータを前記文
字パターン辞書に格納されている各文字パターンおよび
単語辞書に格納されている単語と比較して、読み取った
イメージデータに対する文字候補とその文字候補に対す
る評価値とを求める認識部と、前記認識部の求めた文字
候補の内の第1候補を認識結果として提示するととも
に、操作者の指示に従って認識部の認識結果に対しての
修正処理を実行する修正部と、前記修正部による修正処
理を済ませた認識結果を読取結果としてファイルあるい
は上位のデータ処理装置などに出力する出力部とを備え
る。
文字読取装置は、日本語による文字を光学的に読み取る
もので、文字を光学的に読み取ってイメージデータに変
換する読取部と、文字パターンおよび文字パターンの構
成要素の情報を格納した文字パターン辞書と、単語の構
成文字および品詞および活用法の情報を格納した単語辞
書と、前記読取部から送られたイメージデータを前記文
字パターン辞書に格納されている各文字パターンおよび
単語辞書に格納されている単語と比較して、読み取った
イメージデータに対する文字候補とその文字候補に対す
る評価値とを求める認識部と、前記認識部の求めた文字
候補の内の第1候補を認識結果として提示するととも
に、操作者の指示に従って認識部の認識結果に対しての
修正処理を実行する修正部と、前記修正部による修正処
理を済ませた認識結果を読取結果としてファイルあるい
は上位のデータ処理装置などに出力する出力部とを備え
る。
【0014】そして、さらに、前記修正部には、文字作
成機能と、修正候補表示機能と、候補修正機能とを備え
る。
成機能と、修正候補表示機能と、候補修正機能とを備え
る。
【0015】ここに、文字作成機能は、文字候補を修正
する場合に、既に文字候補として表示している文字の構
成要素を指定すると指定された構成要素を組み合わせ
て、文字あるいは文字の一部を作成する。
する場合に、既に文字候補として表示している文字の構
成要素を指定すると指定された構成要素を組み合わせ
て、文字あるいは文字の一部を作成する。
【0016】前記修正候補表示機能は、前記文字作成機
能によって作成された文字あるいは文字の一部に基づい
て前記文字パターン辞書を検索して、該当する全ての文
字を提示する。
能によって作成された文字あるいは文字の一部に基づい
て前記文字パターン辞書を検索して、該当する全ての文
字を提示する。
【0017】前記候補修正機能は、前記修正候補表示機
能で提示された文字の内、操作者が指定した文字に認識
部による認識結果を修正する。
能で提示された文字の内、操作者が指定した文字に認識
部による認識結果を修正する。
【0018】
【0019】
【作用】 請求項1 に記載した日本語文字読取装置では、
認識部の選んだ文字候補の中に正解文字が無かった場合
は、修正部に装備している文字作成機能,修正候補表示
機能,候補修正機能等の機能の連携によって、操作者は
表示装置の画面上でマウス等を操作するだけで、簡単に
正解文字を得ることができ、操作者が正解文字を指定す
るために漢字コード表を調べる必要がなく、さらに、操
作者に読みがなの入力を強いるカナ漢字変換に頼る必要
もない。
認識部の選んだ文字候補の中に正解文字が無かった場合
は、修正部に装備している文字作成機能,修正候補表示
機能,候補修正機能等の機能の連携によって、操作者は
表示装置の画面上でマウス等を操作するだけで、簡単に
正解文字を得ることができ、操作者が正解文字を指定す
るために漢字コード表を調べる必要がなく、さらに、操
作者に読みがなの入力を強いるカナ漢字変換に頼る必要
もない。
【0020】従って、日本語に不慣れな外国人等が日本
語文字読取装置を使用するような場合でも、操作者に負
担がかからず、日本語文書のデータ化や翻訳処理等にお
ける処理効率の大幅な向上を期待することができる。
語文字読取装置を使用するような場合でも、操作者に負
担がかからず、日本語文書のデータ化や翻訳処理等にお
ける処理効率の大幅な向上を期待することができる。
【0021】
【実施例】図1は、本発明に係る日本語文字読取装置の
一実施例のブロック図である。この一実施例の日本語文
字読取装置は、日本語を他の言語に翻訳する機械翻訳シ
ステムにおける日本語入力手段、あるいは、日本語によ
る文書データをデータベース等に入力する際のデータ入
力手段などとして利用されるもので、図示のように、読
取部1、認識部2、修正部3、出力部4、文字パターン
辞書5、単語辞書6などを構成要素としている。
一実施例のブロック図である。この一実施例の日本語文
字読取装置は、日本語を他の言語に翻訳する機械翻訳シ
ステムにおける日本語入力手段、あるいは、日本語によ
る文書データをデータベース等に入力する際のデータ入
力手段などとして利用されるもので、図示のように、読
取部1、認識部2、修正部3、出力部4、文字パターン
辞書5、単語辞書6などを構成要素としている。
【0022】前記読取部1は、紙などに印刷あるいは手
書きされている文字を光学的に読み取り、イメージデー
タに変換して認識部2に送る。また、前記文字パターン
辞書5は、文字パターンおよび文字パターンの構成要素
および構成要素の配置位置などの情報を格納している。
そして、単語辞書6は、単語の構成文字および品詞およ
び活用法などの情報を格納している。
書きされている文字を光学的に読み取り、イメージデー
タに変換して認識部2に送る。また、前記文字パターン
辞書5は、文字パターンおよび文字パターンの構成要素
および構成要素の配置位置などの情報を格納している。
そして、単語辞書6は、単語の構成文字および品詞およ
び活用法などの情報を格納している。
【0023】前記認識部2は、前記読取部1から送られ
たイメージデータを前記文字パターン辞書5に格納され
ている各文字パターンおよび単語辞書6に格納されてい
る単語と比較して、読み取ったイメージデータに対する
文字候補とその文字候補に対する評価値とを求めて、求
めた結果を修正部3に送る。
たイメージデータを前記文字パターン辞書5に格納され
ている各文字パターンおよび単語辞書6に格納されてい
る単語と比較して、読み取ったイメージデータに対する
文字候補とその文字候補に対する評価値とを求めて、求
めた結果を修正部3に送る。
【0024】前記修正部3は、後で詳述するが、認識部
2から送られてきた文字候補の内の第1候補を認識結果
として提示するとともに、操作者の指示に従って認識部
2の認識結果に対しての修正処理を実行して、修正結果
を出力部4に送る。
2から送られてきた文字候補の内の第1候補を認識結果
として提示するとともに、操作者の指示に従って認識部
2の認識結果に対しての修正処理を実行して、修正結果
を出力部4に送る。
【0025】前記出力部4は、前記修正部3から送られ
てきた文字列等の情報を、読取結果として、ファイルあ
るいは上位のデータ処理装置などに出力する。
てきた文字列等の情報を、読取結果として、ファイルあ
るいは上位のデータ処理装置などに出力する。
【0026】一実施例の日本語文字読取装置は、以上の
構成要素によって、紙などに記述されている日本語文字
を光学的に読み取る。図2は、前記一実施例の日本語文
字読取装置における読取処理の概略を示したフローチャ
ートである。
構成要素によって、紙などに記述されている日本語文字
を光学的に読み取る。図2は、前記一実施例の日本語文
字読取装置における読取処理の概略を示したフローチャ
ートである。
【0027】次に、図3に示す紙片7上の文字を読み取
って、読取結果に対して修正などを行ってファイルに出
力するまでの処理の流れを、図2に基づいて説明する。
って、読取結果に対して修正などを行ってファイルに出
力するまでの処理の流れを、図2に基づいて説明する。
【0028】まず、読取部1が紙片7上に記述されてい
る文字を読み取って、イメージデータとして認識部2に
送る(ステップ10)。すると、認識部2は、まず、イ
メージ分割処理を行う(ステップ20)。このイメージ
分割処理とは、読取部1から送られてきたイメージデー
タを段落,行といった文字のまとまりに分割し、分割し
た文字のまとまりに対してさらに分割処理を行って最終
的に一つ一つの文字に分割するものである。図4は、前
記ステップ20のイメージ分割処理によって得た1文字
毎のイメージデータ(文字データ)を示したものであ
る。
る文字を読み取って、イメージデータとして認識部2に
送る(ステップ10)。すると、認識部2は、まず、イ
メージ分割処理を行う(ステップ20)。このイメージ
分割処理とは、読取部1から送られてきたイメージデー
タを段落,行といった文字のまとまりに分割し、分割し
た文字のまとまりに対してさらに分割処理を行って最終
的に一つ一つの文字に分割するものである。図4は、前
記ステップ20のイメージ分割処理によって得た1文字
毎のイメージデータ(文字データ)を示したものであ
る。
【0029】次いで、ステップ20で分割した1文字分
のイメージデータ毎に、文字パターン辞書5に格納され
ている文字パターンとのマッチングを行い、類似度を計
算する(ステップ21)。ここに、類似度は、0〜10
0の整数値で示され、数値が大きい程よく類似している
ことを意味する。
のイメージデータ毎に、文字パターン辞書5に格納され
ている文字パターンとのマッチングを行い、類似度を計
算する(ステップ21)。ここに、類似度は、0〜10
0の整数値で示され、数値が大きい程よく類似している
ことを意味する。
【0030】そして、類似度が70以上となる文字をそ
の読取文字(イメージデータ)の文字候補とし、前記類
似度をその文字候補に対する評価値(文字評価値)とす
る(ステップ22)。次いで、ステップ22の処理を済
ませたイメージデータが、前記ステップ20で分割した
最後の1文字分のイメージデータであるか否かを判断
し、最後のイメージデータでない場合には、処理対象の
イメージデータを次の1文字に更新してステップ21に
戻ることによって(ステップ23,24)、ステップ2
0で1文字毎に分割された全てのイメージデータに対し
てステップ21,22を繰り返す。
の読取文字(イメージデータ)の文字候補とし、前記類
似度をその文字候補に対する評価値(文字評価値)とす
る(ステップ22)。次いで、ステップ22の処理を済
ませたイメージデータが、前記ステップ20で分割した
最後の1文字分のイメージデータであるか否かを判断
し、最後のイメージデータでない場合には、処理対象の
イメージデータを次の1文字に更新してステップ21に
戻ることによって(ステップ23,24)、ステップ2
0で1文字毎に分割された全てのイメージデータに対し
てステップ21,22を繰り返す。
【0031】図5は、前記ステップ21〜24までの処
理によって得た文字候補および各文字候補毎の評価値を
示したものである。図5においては、最上位の行Gに記
述した番号1,2,……,9,……は前記ステップ20
で分割した1文字毎のイメージデータの順番に対応し、
各イメージデータに対する文字候補が各イメージデータ
毎に評価値の高い順に縦方向に並べられている。文字候
補として示した文字の下に付けた数値が評価値(類似
度)である。
理によって得た文字候補および各文字候補毎の評価値を
示したものである。図5においては、最上位の行Gに記
述した番号1,2,……,9,……は前記ステップ20
で分割した1文字毎のイメージデータの順番に対応し、
各イメージデータに対する文字候補が各イメージデータ
毎に評価値の高い順に縦方向に並べられている。文字候
補として示した文字の下に付けた数値が評価値(類似
度)である。
【0032】図5に示した具体例では、先頭のイメージ
データ(図4において、1番目の文字「日」に対するイ
メージデータ)に対しては、文字候補として「白」,
「日」,「月」,「旦」等が挙げられ、各文字候補に対
する評価値は、それぞれ、92,91,78,72とな
っている。
データ(図4において、1番目の文字「日」に対するイ
メージデータ)に対しては、文字候補として「白」,
「日」,「月」,「旦」等が挙げられ、各文字候補に対
する評価値は、それぞれ、92,91,78,72とな
っている。
【0033】前記ステップ21〜24によって文字候補
およびその評価値が全てのイメージデータ(文字)に対
して求められると、次には、連続したイメージデータの
文字候補同士の組み合わせによる単語について単語辞書
6を検索し、単語辞書6内に該当する単語が見つかった
場合には、それを単語候補として設定するとともに、そ
の単語候補を構成している各文字候補の評価値の和を単
語評価値として算出する(ステップ25)。例えば、文
字候補あるいは文字候補の組み合わせによる単語である
「白」,「日」,……「白本」,「白木」,「日本」,
……,「日本語」,……等に対して単語辞書6を検索し
た結果、単語辞書6内に格納されている単語として、
「白」,「日」,「月」,「白木」,「日本」,「日本
語」,……が確認された場合、それらの確認された単語
が単語候補として設定される。そして、例えば、単語候
補の「白木」に対しては、文字候補「白」の評価値92
と「木」の評価値80との和であるの172が、単語評
価値として算出される。
およびその評価値が全てのイメージデータ(文字)に対
して求められると、次には、連続したイメージデータの
文字候補同士の組み合わせによる単語について単語辞書
6を検索し、単語辞書6内に該当する単語が見つかった
場合には、それを単語候補として設定するとともに、そ
の単語候補を構成している各文字候補の評価値の和を単
語評価値として算出する(ステップ25)。例えば、文
字候補あるいは文字候補の組み合わせによる単語である
「白」,「日」,……「白本」,「白木」,「日本」,
……,「日本語」,……等に対して単語辞書6を検索し
た結果、単語辞書6内に格納されている単語として、
「白」,「日」,「月」,「白木」,「日本」,「日本
語」,……が確認された場合、それらの確認された単語
が単語候補として設定される。そして、例えば、単語候
補の「白木」に対しては、文字候補「白」の評価値92
と「木」の評価値80との和であるの172が、単語評
価値として算出される。
【0034】なお、前記ステップ25において、連続し
たイメージデータの文字候補同士の組み合わせによる単
語について単語辞書6を検索する処理は、前記ステップ
21〜24で得た文字候補に対する全ての組み合わせに
ついて行う。図6は、前記ステップ25の処理で得た単
語候補、および各単語候補に対する単語評価値を示して
いる。なお、この図6において、最上位の行Hに記述し
た番号1,2,……,9,……は前記ステップ20で分
割した1文字毎のイメージデータの順番に対応してい
る。また、各単語候補の文字の下に記述された数値が単
語評価値である。次いで、ステップ25で求めた単語候
補相互の接続可能性のチェックを行い、接続できないも
のは単語候補から削除する(ステップ26)。なお、漢
字1文字から構成される単語は連続しないものとする。
そして、単語評価値が大きい順に、単語評価値がない場
合は文字評価値が大きい順に第1候補,第2候補,……
と文字候補の順位を決定する(ステップ27)。以上の
ステップ20〜27までの処理は、認識部2によるもの
である。
たイメージデータの文字候補同士の組み合わせによる単
語について単語辞書6を検索する処理は、前記ステップ
21〜24で得た文字候補に対する全ての組み合わせに
ついて行う。図6は、前記ステップ25の処理で得た単
語候補、および各単語候補に対する単語評価値を示して
いる。なお、この図6において、最上位の行Hに記述し
た番号1,2,……,9,……は前記ステップ20で分
割した1文字毎のイメージデータの順番に対応してい
る。また、各単語候補の文字の下に記述された数値が単
語評価値である。次いで、ステップ25で求めた単語候
補相互の接続可能性のチェックを行い、接続できないも
のは単語候補から削除する(ステップ26)。なお、漢
字1文字から構成される単語は連続しないものとする。
そして、単語評価値が大きい順に、単語評価値がない場
合は文字評価値が大きい順に第1候補,第2候補,……
と文字候補の順位を決定する(ステップ27)。以上の
ステップ20〜27までの処理は、認識部2によるもの
である。
【0035】修正部3は、修正処理のためのガイダンス
や前記ステップ10で読み取ったイメージデータを表示
装置の画面上に表示し、また、ステップ27で第1候補
に設定された候補文字による文字列を認識結果として表
示装置の画面上に表示し、さらに、認識結果として表示
した文字列上の指定文字に対しては、該当するイメージ
データ(文字)の第2候補以降の全ての候補文字を表示
装置の画面上に表示して、操作者の指示に基づく修正処
理を行う(ステップ30)。なお、修正部3による修正
処理については、後に詳述する。
や前記ステップ10で読み取ったイメージデータを表示
装置の画面上に表示し、また、ステップ27で第1候補
に設定された候補文字による文字列を認識結果として表
示装置の画面上に表示し、さらに、認識結果として表示
した文字列上の指定文字に対しては、該当するイメージ
データ(文字)の第2候補以降の全ての候補文字を表示
装置の画面上に表示して、操作者の指示に基づく修正処
理を行う(ステップ30)。なお、修正部3による修正
処理については、後に詳述する。
【0036】次いで、出力部4が、前記修正部3による
修正処理後の第1候補による文字列を認識結果として、
操作者の指示に従ってファイルあるいは上位のデータ処
理装置などに出力する(ステップ40)。
修正処理後の第1候補による文字列を認識結果として、
操作者の指示に従ってファイルあるいは上位のデータ処
理装置などに出力する(ステップ40)。
【0037】以上で、日本語文字読取の一連の処理を終
了する次に、修正部3に装備された諸機能および修正部
3における処理について詳述する。図7は、前記修正部
3が表示装置の画面に表示する画面構成を示したもので
ある。
了する次に、修正部3に装備された諸機能および修正部
3における処理について詳述する。図7は、前記修正部
3が表示装置の画面に表示する画面構成を示したもので
ある。
【0038】この図7において、符号100〜107は
処理を指示するためのガイダンス、110は読取部1で
読み取ったイメージをそのまま表示するイメージ表示
部、111はイメージ表示部110内の領域を指定する
ための領域指定枠、120は前記領域指定枠111によ
って指定された領域内のイメージデータに対する認識部
2の認識結果(第1候補)を表示するための認識結果表
示部、121は前記認識結果表示部120内の一つの文
字を指定するためのカーソル、130は前記カーソル1
21によって指定された文字の文字候補を全て表示する
ための候補表示部である。また、131は候補表示部1
30内の一つの候補を指定するためのカーソル、140
はカーソル121によって指定された文字の付近の拡大
したイメージデータである。
処理を指示するためのガイダンス、110は読取部1で
読み取ったイメージをそのまま表示するイメージ表示
部、111はイメージ表示部110内の領域を指定する
ための領域指定枠、120は前記領域指定枠111によ
って指定された領域内のイメージデータに対する認識部
2の認識結果(第1候補)を表示するための認識結果表
示部、121は前記認識結果表示部120内の一つの文
字を指定するためのカーソル、130は前記カーソル1
21によって指定された文字の文字候補を全て表示する
ための候補表示部である。また、131は候補表示部1
30内の一つの候補を指定するためのカーソル、140
はカーソル121によって指定された文字の付近の拡大
したイメージデータである。
【0039】前記修正部3は、認識部2で求めた候補文
字を図7の修正画面上で修正するための機能として、評
価識別表示機能3a、文字作成機能3b、修正候補表示
機能3c、候補修正機能3dなどの諸機能を装備してい
る。
字を図7の修正画面上で修正するための機能として、評
価識別表示機能3a、文字作成機能3b、修正候補表示
機能3c、候補修正機能3dなどの諸機能を装備してい
る。
【0040】ここに、評価識別表示機能3aは、前記認
識部2の認識結果として第1候補による文字列を前記認
識結果表示部120に表示する場合に、前記認識部2で
求めた文字候補の第1候補の評価値が予め設定された基
準以下の文字と、第1候補と第2候補との評価値の差が
予め設定された基準以下の文字とについてその旨を明示
する機能である。
識部2の認識結果として第1候補による文字列を前記認
識結果表示部120に表示する場合に、前記認識部2で
求めた文字候補の第1候補の評価値が予め設定された基
準以下の文字と、第1候補と第2候補との評価値の差が
予め設定された基準以下の文字とについてその旨を明示
する機能である。
【0041】前述の認識部2で求めた文字候補の第1候
補の評価値が予め設定された基準以下であるか否かの判
断基準は、この一実施例の場合、第1候補の候補文字に
ついての単語評価値が存在するか否かであり、単語評価
値が存在しない場合には、濃い網かけを施すことによっ
て単語評価値が存在する候補と識別可能に表示する。な
お、単語評価値が存在しない場合とは、候補となってい
る文字が単語辞書6に存在しない場合で、候補となって
いる文字が正解文字でない確率が極めて高いこと、即
ち、修正すべき可能性が高いことを意味している。
補の評価値が予め設定された基準以下であるか否かの判
断基準は、この一実施例の場合、第1候補の候補文字に
ついての単語評価値が存在するか否かであり、単語評価
値が存在しない場合には、濃い網かけを施すことによっ
て単語評価値が存在する候補と識別可能に表示する。な
お、単語評価値が存在しない場合とは、候補となってい
る文字が単語辞書6に存在しない場合で、候補となって
いる文字が正解文字でない確率が極めて高いこと、即
ち、修正すべき可能性が高いことを意味している。
【0042】また、この一実施例の場合、第1候補と第
2候補との評価値の差が予め設定された基準以下である
か否かの判断基準は、第1候補と第2候補との単語評価
値の差が70以下であるか否かであり、差が70以下の
場合には、薄い網かけを施すことによって、差が70以
上の候補および単語評価値が存在しない候補のいずれと
も識別可能に表示する。なお、第1候補と第2候補との
単語評価値の差が70以下の場合とは、正解文字となる
蓋然性が接近した複数の単語候補が存在することを意味
し、この場合も、候補となっている文字が正解文字でな
い確率が高いことを意味している。
2候補との評価値の差が予め設定された基準以下である
か否かの判断基準は、第1候補と第2候補との単語評価
値の差が70以下であるか否かであり、差が70以下の
場合には、薄い網かけを施すことによって、差が70以
上の候補および単語評価値が存在しない候補のいずれと
も識別可能に表示する。なお、第1候補と第2候補との
単語評価値の差が70以下の場合とは、正解文字となる
蓋然性が接近した複数の単語候補が存在することを意味
し、この場合も、候補となっている文字が正解文字でな
い確率が高いことを意味している。
【0043】また、文字作成機能3bは、文字候補を修
正する場合に、既に文字候補として表示している文字の
構成要素を指定すると指定された構成要素を組み合わせ
て、文字あるいは文字の一部を作成する機能である。
正する場合に、既に文字候補として表示している文字の
構成要素を指定すると指定された構成要素を組み合わせ
て、文字あるいは文字の一部を作成する機能である。
【0044】修正候補表示機能3cは、前記文字作成機
能3bによって作成された文字あるいは文字の一部に基
づいて前記文字パターン辞書5を検索して、該当する全
ての文字を提示する機能である。
能3bによって作成された文字あるいは文字の一部に基
づいて前記文字パターン辞書5を検索して、該当する全
ての文字を提示する機能である。
【0045】そして、候補修正機能3dは、前記修正候
補表示機能3cによって画面上に提示された文字の内、
操作者が指定した文字に認識部2による認識結果を修正
する機能である。
補表示機能3cによって画面上に提示された文字の内、
操作者が指定した文字に認識部2による認識結果を修正
する機能である。
【0046】以下、前述の各機能3a〜3dを利用した
修正部3における修正処理の流れを、図8に基づいて説
明する。使用者は、修正が必要な文字が現在の領域指定
枠111内に有るか否かを判断し、修正が必要な文字が
現在の領域指定枠111内にない場合には、領域指定枠
111を移動する(ステップ301,302)。そし
て、マウスなどを用いて修正が必要な文字上にカーソル
121を移動することによって修正文字を選択する(ス
テップ303)。修正部3は、カーソル121によって
選択された文字の文字候補を候補表示部130に表示す
る。
修正部3における修正処理の流れを、図8に基づいて説
明する。使用者は、修正が必要な文字が現在の領域指定
枠111内に有るか否かを判断し、修正が必要な文字が
現在の領域指定枠111内にない場合には、領域指定枠
111を移動する(ステップ301,302)。そし
て、マウスなどを用いて修正が必要な文字上にカーソル
121を移動することによって修正文字を選択する(ス
テップ303)。修正部3は、カーソル121によって
選択された文字の文字候補を候補表示部130に表示す
る。
【0047】例えば、操作者がカーソル121によって
「文」を選択した場合、修正部3は、候補表示部130
に文字候補として「文」,「女」,「大」を表示する。
操作者は、前記候補表示部130に表示された文字候補
を見て、正解文字が含まれているか否かを判断し(ステ
ップ304)、候補表示部130に表示された文字候補
に正解文字が含まれている場合には、カーソル131を
正解文字上に移動させることによって、変更する候補を
指定する(ステップ305)。変更文字が指定された場
合、修正部3は、認識結果をカーソル131によって指
定された文字候補に修正する(ステップ306)。
「文」を選択した場合、修正部3は、候補表示部130
に文字候補として「文」,「女」,「大」を表示する。
操作者は、前記候補表示部130に表示された文字候補
を見て、正解文字が含まれているか否かを判断し(ステ
ップ304)、候補表示部130に表示された文字候補
に正解文字が含まれている場合には、カーソル131を
正解文字上に移動させることによって、変更する候補を
指定する(ステップ305)。変更文字が指定された場
合、修正部3は、認識結果をカーソル131によって指
定された文字候補に修正する(ステップ306)。
【0048】一方、前記ステップ304において候補表
示部130に表示した候補内に正解文字がないと判断し
た場合には、操作者はガイダンスの文字入力処理(inpu
t character)を指定する(ステップ307)。操作者
から文字入力処理が指定されると、修正部3は、図9に
示すように、文字入力のためのウィンドウ350を開
き、該ウィンドウ350内に前記候補表示部130に示
していた各文字候補を構成要素に分割して表示する。
示部130に表示した候補内に正解文字がないと判断し
た場合には、操作者はガイダンスの文字入力処理(inpu
t character)を指定する(ステップ307)。操作者
から文字入力処理が指定されると、修正部3は、図9に
示すように、文字入力のためのウィンドウ350を開
き、該ウィンドウ350内に前記候補表示部130に示
していた各文字候補を構成要素に分割して表示する。
【0049】図9は、カーソル121が文字候補「誌」
にある状態でガイダンス105の文字入力処理(input
character)が指定された場合のものである。ウィンド
ウ350において、文字「誌」は、左半分の「言」,右
上半分の「士」,右下半分の「心」の3つの構成要素に
分割されている。
にある状態でガイダンス105の文字入力処理(input
character)が指定された場合のものである。ウィンド
ウ350において、文字「誌」は、左半分の「言」,右
上半分の「士」,右下半分の「心」の3つの構成要素に
分割されている。
【0050】ここで、操作者は、マウスなどを用いて前
記ウィンドウ350内に表示している文字の構成要素か
ら必要な構成要素を指定して、ウィンドウ350内に点
線枠で示した文字入力領域351に移動させて、文字入
力領域351内に正解文字あるいは正解文字の一部を作
成する(ステップ308)。このステップ308におけ
る文字作成処理は、前記文字作成機能3bによるもので
ある。
記ウィンドウ350内に表示している文字の構成要素か
ら必要な構成要素を指定して、ウィンドウ350内に点
線枠で示した文字入力領域351に移動させて、文字入
力領域351内に正解文字あるいは正解文字の一部を作
成する(ステップ308)。このステップ308におけ
る文字作成処理は、前記文字作成機能3bによるもので
ある。
【0051】操作者は、ステップ308における操作が
終了したら、文字検索を指定する。文字検索が指定され
ると、修正部3は、前記修正候補表示機能3cを起動さ
せる。この修正候補表示機能3cでは、前記文字入力領
域351内に作成された文字構成要素をキーとして、文
字パターン辞書5を検索し、該当する全ての文字を提示
する(ステップ309)。
終了したら、文字検索を指定する。文字検索が指定され
ると、修正部3は、前記修正候補表示機能3cを起動さ
せる。この修正候補表示機能3cでは、前記文字入力領
域351内に作成された文字構成要素をキーとして、文
字パターン辞書5を検索し、該当する全ての文字を提示
する(ステップ309)。
【0052】例えば、使用者が、図10に示すように、
正解文字の構成要素として「誌」の左半分の「言」を文
字入力領域351に作成して、文字検索を指定した場
合、前記修正候補表示機能3cでは、「言」をキーとし
て文字パターン辞書5を検索し、「計」,「訂」,
「訃」,……,「認」,……を該当文字として候補表示
部130等に表示する。また、図11に示すように、正
解文字の構成要素として「誌」の左半分の「言」と
「綛」の右半分の「忍」とを組み合わせた文字を文字入
力領域351に作成して、文字検索を指定した場合、前
記修正候補表示機能3cでは、「言」と「忍」とをキー
として文字パターン辞書5を検索し、「認」を該当文字
として表示する。
正解文字の構成要素として「誌」の左半分の「言」を文
字入力領域351に作成して、文字検索を指定した場
合、前記修正候補表示機能3cでは、「言」をキーとし
て文字パターン辞書5を検索し、「計」,「訂」,
「訃」,……,「認」,……を該当文字として候補表示
部130等に表示する。また、図11に示すように、正
解文字の構成要素として「誌」の左半分の「言」と
「綛」の右半分の「忍」とを組み合わせた文字を文字入
力領域351に作成して、文字検索を指定した場合、前
記修正候補表示機能3cでは、「言」と「忍」とをキー
として文字パターン辞書5を検索し、「認」を該当文字
として表示する。
【0053】操作者は、修正候補表示機能3cによって
表示された文字のうちの正解文字をマウス等を用いて指
定する。すると、前述の候補修正機能3dが作動して、
認識結果を操作者が指定した文字に修正する(ステップ
310)。
表示された文字のうちの正解文字をマウス等を用いて指
定する。すると、前述の候補修正機能3dが作動して、
認識結果を操作者が指定した文字に修正する(ステップ
310)。
【0054】操作者は、イメージ表示部110内の領域
指定枠111の移動操作および認識結果表示部120内
のカーソル121の移動操作によって、読取部1で読み
取った文字中の任意の文字を修正部3による修正対象と
することができ、修正したい認識結果が残っている場合
には、領域指定枠111あるいはカーソル121の移動
操作によって修正対象を切り替えて、ステップ301〜
310の処理を繰り返し、認識結果に対しての修正処理
を全て終了した場合には、ガイダンスの終了(quit)を
指定すると、修正部3による一連の修正処理が終了する
(ステップ312)。
指定枠111の移動操作および認識結果表示部120内
のカーソル121の移動操作によって、読取部1で読み
取った文字中の任意の文字を修正部3による修正対象と
することができ、修正したい認識結果が残っている場合
には、領域指定枠111あるいはカーソル121の移動
操作によって修正対象を切り替えて、ステップ301〜
310の処理を繰り返し、認識結果に対しての修正処理
を全て終了した場合には、ガイダンスの終了(quit)を
指定すると、修正部3による一連の修正処理が終了する
(ステップ312)。
【0055】以上に詳述した一実施例の日本語文字読取
装置では、修正部3によって修正処理を行う場合、前記
認識部2による認識結果の内で修正を必要とする可能性
が高い文字候補は、評価識別表示機能3aによる識別表
示によって明示される。そのため、操作者が1文字ずつ
認識結果と原文とを照合せずとも修正の必要がある文字
を容易に知ることができて、装置の認識結果が正しいか
否かの確認を迅速かつ容易にすることのでき、また、操
作者の負担も軽減される。
装置では、修正部3によって修正処理を行う場合、前記
認識部2による認識結果の内で修正を必要とする可能性
が高い文字候補は、評価識別表示機能3aによる識別表
示によって明示される。そのため、操作者が1文字ずつ
認識結果と原文とを照合せずとも修正の必要がある文字
を容易に知ることができて、装置の認識結果が正しいか
否かの確認を迅速かつ容易にすることのでき、また、操
作者の負担も軽減される。
【0056】また、認識部2の選んだ文字候補の中に正
解文字が無かった場合は、修正部3に装備している文字
作成機能3b,修正候補表示機能3c,候補修正機能3
d等の機能の連携によって、操作者は表示装置の画面上
でマウス等を操作するだけで、簡単に正解文字を得るこ
とができ、操作者が正解文字を指定するために漢字コー
ド表を調べる必要がなく、さらに、操作者に読みがなの
入力を強いるカナ漢字変換に頼る必要もない。
解文字が無かった場合は、修正部3に装備している文字
作成機能3b,修正候補表示機能3c,候補修正機能3
d等の機能の連携によって、操作者は表示装置の画面上
でマウス等を操作するだけで、簡単に正解文字を得るこ
とができ、操作者が正解文字を指定するために漢字コー
ド表を調べる必要がなく、さらに、操作者に読みがなの
入力を強いるカナ漢字変換に頼る必要もない。
【0057】従って、日本語に不慣れな外国人等が日本
語文字読取装置を使用するような場合でも、操作者に負
担がかからず、日本語文書のデータ化や翻訳処理等にお
ける処理効率の大幅な向上を期待することができる。
語文字読取装置を使用するような場合でも、操作者に負
担がかからず、日本語文書のデータ化や翻訳処理等にお
ける処理効率の大幅な向上を期待することができる。
【0058】なお、前記修正部3の評価識別表示機能3
aにおいて、認識部2で求めた文字候補の第1候補の評
価値が予め設定された基準以下であるか否かの判断基準
や、第1候補と第2候補との評価値の差が予め設定され
た基準以下であるか否かの判断基準は、いずれも、一実
施例のものに限定するものではない。例えば、認識部2
で求めた文字候補の第1候補の評価値が予め設定された
基準以下であるか否かの判断基準として、文字候補の評
価値あるいは単語候補における単語評価値の具体的数値
を設定することも考えられる。また、第1候補と第2候
補との評価値の差が予め設定された基準以下であるか否
かの判断基準としては、文字候補の評価値の具体的数値
を採用することも考えられるし、また、判断基準として
の具体的数値として一実施例の値(70)よりも大きい
値を設定したり、あるいは小さい値を設定することも考
えられる。
aにおいて、認識部2で求めた文字候補の第1候補の評
価値が予め設定された基準以下であるか否かの判断基準
や、第1候補と第2候補との評価値の差が予め設定され
た基準以下であるか否かの判断基準は、いずれも、一実
施例のものに限定するものではない。例えば、認識部2
で求めた文字候補の第1候補の評価値が予め設定された
基準以下であるか否かの判断基準として、文字候補の評
価値あるいは単語候補における単語評価値の具体的数値
を設定することも考えられる。また、第1候補と第2候
補との評価値の差が予め設定された基準以下であるか否
かの判断基準としては、文字候補の評価値の具体的数値
を採用することも考えられるし、また、判断基準として
の具体的数値として一実施例の値(70)よりも大きい
値を設定したり、あるいは小さい値を設定することも考
えられる。
【0059】
【0060】
【発明の効果】 以上の説明から明らかなように、 請求項
1に記載した日本語文字読取装置では、認識部の選んだ
文字候補の中に正解文字が無かった場合は、修正部に装
備している文字作成機能,修正候補表示機能,候補修正
機能等の機能の連携によって、操作者は表示装置の画面
上でマウス等を操作するだけで、簡単に正解文字を得る
ことができ、操作者が正解文字を指定するために漢字コ
ード表を調べる必要がなく、さらに、操作者に読みがな
の入力を強いるカナ漢字変換に頼る必要もない。
1に記載した日本語文字読取装置では、認識部の選んだ
文字候補の中に正解文字が無かった場合は、修正部に装
備している文字作成機能,修正候補表示機能,候補修正
機能等の機能の連携によって、操作者は表示装置の画面
上でマウス等を操作するだけで、簡単に正解文字を得る
ことができ、操作者が正解文字を指定するために漢字コ
ード表を調べる必要がなく、さらに、操作者に読みがな
の入力を強いるカナ漢字変換に頼る必要もない。
【0061】従って、日本語に不慣れな外国人等が日本
語文字読取装置を使用するような場合でも、操作者に負
担がかからず、日本語文書のデータ化や翻訳処理等にお
ける処理効率の大幅な向上を期待することができる。
語文字読取装置を使用するような場合でも、操作者に負
担がかからず、日本語文書のデータ化や翻訳処理等にお
ける処理効率の大幅な向上を期待することができる。
【図1】本発明の一実施例のブロック図である。
【図2】本発明の一実施例の読取処理の概略を示すフロ
ーチャートである。
ーチャートである。
【図3】本発明の一実施例で読み取る原文の説明図であ
る。
る。
【図4】本発明の一実施例においてイメージ分割処理し
たイメージデータの説明図である。
たイメージデータの説明図である。
【図5】本発明の一実施例における文字候補の選択例の
説明図である。
説明図である。
【図6】本発明の一実施例における単語候補および単語
評価値の算出例である。
評価値の算出例である。
【図7】本発明の一実施例の修正部による画面表示例の
説明図である。
説明図である。
【図8】本発明の一実施例の修正部における修正処理の
フローチャートである。
フローチャートである。
【図9】本発明の一実施例の修正部による画面表示例の
説明図である。
説明図である。
【図10】本発明の一実施例の修正部による画面表示例
の説明図である。
の説明図である。
【図11】本発明の一実施例の修正部による画面表示例
の説明図である。
の説明図である。
1 読取部 2 認識部 3 修正部 3a 評価識別表示機能 3b 文字作成機能 3c 修正候補表示機能 3d 候補修正機能 4 出力部 5 文字パターン辞書 6 単語辞書 7 紙片 100〜107 ガイダンス 110 イメージ表示部 111 領域指定枠 120 認識結果表示部 121 カーソル 130 候補表示部 131 カーソル 140 イメージデータ 350 ウィンドウ 351 文字入力領域
Claims (1)
- 【請求項1】 日本語による文字を光学的に読み取る日
本語文字読取装置であって、 文字を光学的に読み取ってイメージデータに変換する読
取部と、 文字パターンおよび文字パターンの構成要素の情報を格
納した文字パターン辞書と、 単語の構成文字および品詞および活用法の情報を格納し
た単語辞書と、 前記読取部から送られたイメージデータを前記文字パタ
ーン辞書に格納されている各文字パターンおよび単語辞
書に格納されている単語と比較して、読み取ったイメー
ジデータに対する文字候補とその文字候補に対する評価
値とを求める認識部と、 前記認識部の求めた文字候補の内の第1候補を認識結果
として提示するとともに、操作者の指示に従って認識部
の認識結果に対しての修正処理を実行する修正部と、 前記修正部による修正処理を済ませた認識結果を読取結
果としてファイルあるいは上位のデータ処理装置などに
出力する出力部とを備え、 前記修正部には、文字候補を修正する場合に、既に文字候補として表示し
ている文字の構成要素を指定すると指定された構成要素
を組み合わせて、文字あるいは文字の一部を作成する文
字作成機能と、 この文字作成機能によって作成された文字あるいは文字
の一部に基づいて前記文字パターン辞書を検索して、該
当する全ての文字を提示する修正候補表示機能と、 この修正候補表示機能で提示された文字の内、操作者が
指定した文字に認識部による認識結果を修正する候補修
正機能と を備えたことを特徴とする日本語文字読取装
置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4149258A JP2874815B2 (ja) | 1992-06-09 | 1992-06-09 | 日本語文字読取装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4149258A JP2874815B2 (ja) | 1992-06-09 | 1992-06-09 | 日本語文字読取装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH05342402A JPH05342402A (ja) | 1993-12-24 |
JP2874815B2 true JP2874815B2 (ja) | 1999-03-24 |
Family
ID=15471326
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP4149258A Expired - Fee Related JP2874815B2 (ja) | 1992-06-09 | 1992-06-09 | 日本語文字読取装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2874815B2 (ja) |
-
1992
- 1992-06-09 JP JP4149258A patent/JP2874815B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH05342402A (ja) | 1993-12-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2726568B2 (ja) | 文字認識方法及び装置 | |
EP0844583B1 (en) | Method and apparatus for character recognition | |
JP4071328B2 (ja) | 文書画像処理装置および方法 | |
JP2001344562A (ja) | 文書読取装置および文書読取方法 | |
JPH05151254A (ja) | 文書処理方法およびシステム | |
JPH087033A (ja) | 情報処理方法及び装置 | |
JP2874815B2 (ja) | 日本語文字読取装置 | |
JPH0630107B2 (ja) | 文書処理装置 | |
JP3782467B2 (ja) | 文字入力方法及び装置 | |
JP3274014B2 (ja) | 文字認識装置および文字認識方法 | |
JPH0452509B2 (ja) | ||
JPH06215197A (ja) | 文字認識方法および装置 | |
JP2829186B2 (ja) | 光学的文字読取装置 | |
JP3814000B2 (ja) | 文字列変換装置および文字列変換方法 | |
JP2681572B2 (ja) | 手書き文字の入力方法とその装置 | |
JPH05120472A (ja) | 文字認識装置 | |
JPH11120294A (ja) | 文字認識装置および媒体 | |
JPH0636067A (ja) | 文字読取装置 | |
JP2021149737A (ja) | くずし字認識システム、くずし字認識方法、データセットの作成方法、及びプログラム | |
KR100470346B1 (ko) | 이미지의 클러스터링 방법 및 이 방법을 이용하여 문자를고속으로 입력 및 교정하는 방법 | |
JP2986255B2 (ja) | 文字認識装置 | |
JPH04138583A (ja) | 文字認識装置 | |
JPH0520420A (ja) | 図形処理装置 | |
JPH09114929A (ja) | 文字認識方法および装置 | |
JPH0574867B2 (ja) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090114 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090114 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100114 Year of fee payment: 11 |
|
LAPS | Cancellation because of no payment of annual fees |