JPH0554177A

JPH0554177A - 文字認識装置

Info

Publication number: JPH0554177A
Application number: JP3235395A
Authority: JP
Inventors: Hideaki Yamagata; 秀明山形
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1991-08-22
Filing date: 1991-08-22
Publication date: 1993-03-05

Abstract

(57)【要約】【目的】一般的なテキストエディタを用い、認識結果
を簡単に修正できるようにする。【構成】認識結果を、第１候補と下位候補の文字コー
ドを連続させたテキストデータとして出力する。好まし
くは、このテキストデータに第１候補と下位候補の区切
りのための文字コード、例えば括弧のコードを挿入す
る。【効果】不要文字の削除操作によって認識結果を修正
できる。区切り用文字によって各文字画像に対する第１
候補文字と下位候補文字との識別が容易になり、正解文
字と削除すべき文字の検索が容易になる。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、文字認識装置に係り、
特に、認識結果の出力方式に関する。

【０００２】

【従来の技術】一般的に文字認識によって１００パーセ
ントの認識率を達成することは不可能であるため、従来
から、光学的文字認識装置においては人手作業による認
識結果の修正が考慮されている。この認識結果の修正方
式は、専用エディタを用いる方式と、一般的なテキスト
エディタを用いる方式とに大別される。

【０００３】専用エディタを用いる方式の装置において
は、例えば認識結果の第１候補文字のみがディスプレイ
画面に表示され、ユーザーがキーボードやマウスによっ
て誤認文字を指定すると、その文字の第２候補以下の候
補文字が表示され、その中からユーザーが正解文字を選
ぶことにより、認識結果が修正される。また、第１候補
文字の表示の際に、認識結果の信頼性に応じて表示色を
変える（特公昭６１−６４３０号）というように、認識
結果として得られた様々な情報を修正の際に利用する技
術も考案されている。

【０００４】他方、一般的なテキストエディタを用いる
方式では、認識結果は第１候補文字だけがＡＳＣＩＩ等
の文字コードデータに変換されてディスプレイ画面に表
示され、誤認文字については、それを削除し、正解文字
コードをキーボードより直接入力するという操作によっ
て修正を行なう。

【０００５】

【発明が解決しようとする課題】しかし、専用エディタ
を用いる方式は、次のような欠点がある。まず、通常の
業務でなれた一般的な（汎用の）テキストエディタを用
いることができないため、エディタの操作を学習する必
要があり、習熟するまでは修正効率が悪い。また、第１
候補文字以外の認識結果データも必要であるので、認識
結果は専用のフォーマットで出力されるのが普通である
ため汎用性に欠けるとともに、第１候補文字とそれ以外
の認識結果データが別々のファイルとして出力される場
合には、ファイル数が増え管理が面倒である。

【０００６】他方、一般的なテキストエディタを用いる
方式は、通常の業務で使いなれているテキストエディタ
を用いることができるという利点がある。しかし、誤認
文字の修正には、その削除の操作と正解文字コードをキ
ーボード等から直接入力する操作が必要で、修正作業が
煩雑で手間がかかるという欠点がある。

【０００７】本発明の目的は、文字認識装置の認識結果
の修正を、一般的な（装置専用でない標準的な）テキス
トエディタを用い簡単な操作のみで可能にすることであ
る。

【０００８】

【課題を解決するための手段】請求項１の発明は、１個
の文字画像に対し認識結果として複数個の候補文字を得
る文字認識装置において、認識結果を、各文字画像に対
する第１候補文字と下位候補文字の文字コードを連続さ
せたテキストデータとして出力する手段を有することを
特徴とするものである。

【０００９】請求項２の発明は、請求項１の発明の文字
認識装置において、認識結果を出力する手段が、第１候
補文字の確からしさに応じて、該第１候補文字に続けて
出力する下位候補文字数を増減させることを特徴とする
ものである。

【００１０】請求項３の発明は、請求項１の発明の文字
認識装置において、認識結果を出力する手段が、下位候
補文字のうち、その認識辞書との相違度と、第１候補文
字の認識辞書との相違度との間の差が所定閾値以下の下
位候補文字だけを該第１候補文字に続けて出力すること
を特徴とするものである。

【００１１】請求項４の発明は、請求項１，２または３
の発明の文字認識装置において、認識結果を出力する手
段が、認識結果のテキストデータに、第１候補文字コー
ドと下位候補文字コードとの区切りのためのスペースや
括弧等の特定の文字コードを挿入することを特徴とする
ものである。

【００１２】

【作用】請求項１の発明によれば、文字認識装置または
他のコンピュータシステムにおいて、認識結果のテキス
トデータをディスプレイ画面に出力すると、認識対象の
文書等の各文字の第１候補文字と下位候補文字とが連続
して同時に表示されるが、誤認文字の正解文字は下位候
補文字に含まれている場合が多い。したがって、一般的
なテキストエディタを用い、正解文字以外の不要文字を
削除する操作を行なうだけで、認識結果の誤りの殆どを
修正可能である。

【００１３】文字認識によって求められる候補文字数が
多い場合、それを全て出力すると、ディスプレイ画面上
で正解文字を探しにくく、また削除しなければならない
文字数が多くなって、効率的な修正が困難になることが
ある。しかし、出力する下位候補文字数を一律に減らす
と、表示された文字中に正解文字が見つからない場合が
増加し、正解文字の入力操作の回数が増加してしまう。

【００１４】請求項２の発明によれば、第１候補文字の
確からしさが高く（例えば認識辞書との相違度もしくは
距離が小さい）、それが正解であるか、あるいは比較的
上位の候補文字が正解である可能性が大きいときには、
出力する下位候補文字数を少なくする。逆に、第１候補
文字の確からしさが低く、それが正解である可能性が小
さく、また比較的下位の候補文字が正解文字である可能
性が大きいときには、出力する下位候補文字数を増加さ
せることによって、上に述べたような問題を回避するこ
とができる。

【００１５】下位候補文字のうちで、その認識辞書との
相違度が、第１候補文字の認識辞書との相違度に比べあ
る限度以上に大きいものは、正解である可能性がないと
見做して支障がない。請求項３の発明によれば、そのよ
うな正解である可能性がないような下位候補文字を出力
しないようにすることにより、請求項２と同様の効果を
達成できる。

【００１６】ディスプレイ画面に認識結果が第１候補文
字と下位候補文字の単に羅列した場合、第１候補文字と
下位候補文字を容易に識別できないため、正解文字と削
除すべき不要文字の検索が必ずしも容易でない。請求項
４の発明によれば、認識結果のテキストデータに第１候
補文字と下位候補文字との区切りのための括弧やスペー
ス等の文字コードが挿入されるので、これをディスプレ
イ画面に表示した場合、第１候補文字と下位候補文字と
がスペースや括弧等で区切られ、その識別が容易になる
ため、区切りのためのスペースや括弧等を余分に削除し
なければならないが、正解文字と削除すべき不要文字の
検索が非常に容易になる。

【００１７】

【実施例】以下、図面により本発明の実施例について説
明する。

【００１８】図１に本発明の各実施例に係る文字認識装
置の構成の一例を示す。１は文書の画像データを入力す
るスキャナ、２はその画像データを保存する画像メモリ
である。３は各種の処理や制御を実行する中央演算処理
装置（ＣＰＵ）、４はＣＰＵ３のプログラムを格納する
ためのプログラムメモリ、５はＣＰＵ３によってワーク
エリアとして利用されるデータメモリ、６は文字認識処
理に用いられる認識辞書、７はディスプレイ、８はキー
ボード、９はハードディスクやフロッピーディスク等の
ファイル装置である。

【００１９】プログラムメモリ４はＲＯＭ領域とＲＡＭ
領域があり、ＲＯＭ領域には文字認識処理プログラム１
０と認識結果出力プログラム１１が固定的に格納され
る。プログラムメモリ４のＲＡＭ領域には、ファイル装
置８より各種アプリケーションプログラムが必要に応じ
てロードされる。認識結果の修正を行なう場合には、一
般的な（汎用の）テキストエディタプログラム１２がロ
ードされる。

【００２０】文字認識処理プログラム１１がＣＰＵ３上
で走ることによって、文字認識処理が実行される。この
文字認識処理の内容は一般的なものでよく、画像メモリ
２内の画像データより文字画像が切り出され、その特徴
量が抽出されて認識辞書６と比較され、認識辞書６との
相違度（特徴量の距離）の小さい順に例えば第３候補ま
での候補文字が求められ、各候補文字とその相違度が認
識結果データとしてデータメモリ５上の認識結果バッフ
ァ１３に保存される。認識結果バッファ１３内のデータ
フォーマットは任意でよい。なお、ここでは説明を簡略
にするため、認識辞書６との照合によって得られた結果
を最終的な認識結果としているが、この認識結果に対し
て単語照合等の後処理を行ない、その結果を認識結果バ
ッファ１３に得てもよいことは当然である。

【００２１】この文字認識処理の実行中、あるいは文字
認識処理の終了後に、認識結果処理プログラム１１を走
らせることにより、認識結果の出力が可能である。この
認識結果出力処理は以下の各実施例毎に異なるが、基本
的には、認識結果の第１候補文字と下位候補文字の文字
コードを連続させたテキストデータとして出力するもの
で、このテキストデータはデータメモリ５上にテキスト
ファイル１４として一時的に保存される。同時に認識結
果の修正を行なう場合、このテキストファイル１４の内
容を直ちにディスプレイ７の画面に出力させることがで
きるが、後で修正する場合、あるいは他のコンピュータ
システム上で修正する場合には、ファイル装置９に出力
させることもできる。なお、テキストファイル１４のフ
ォーマットは、一般的なテキストエディタによって操作
可能な標準的なもの、例えばＭＳ−ＤＯＳフォーマット
とされる。

【００２２】当該装置において認識結果の修正作業を行
なう場合、データメモリ５上に認識結果のテキストファ
イル１４を置き、その内容をディスプレイ７の画面に表
示させ、テキストエディタプログラム１２を走らせる。
作業者は、キーボード８のカーソル移動キーを操作して
画面上のカーソルを不要文字に合わせ削除キーを押下す
る操作の繰り返しによって、殆どの誤認文字を修正する
ことができる。キーボード８による正解文字コードの入
力操作が必要となるのは、画面上に正解文字が見つから
ない場合に限られ、その頻度は少ない。

【００２３】次に、図２に示すような認識結果データが
認識結果バッファ１３に得られた場合を例にして、各実
施例における認識結果出力処理の内容を説明する。

【００２４】実施例１認識結果出力処理のフローを図３に示す。認識結果バッ
ファ１３内の一つの文字画像に対する第１候補文字コー
ドをテキストファイル１４に書き出し（ステップ１０
２）、これに続けて区切り用の前括弧のコードを書き出
し（ステップ１０４）、次に第２候補文字コードと第３
候補文字コードを順に書き出し（ステップ１０６）、最
後に区切り用の後括弧のコードを書き出す（ステップ１
０８）。同様のテキストファイル１４に対する書き出し
処理を、認識結果バッファ１３内の最後のデータまで繰
り返す。ただし、区切り用の文字コードは、候補文字と
区別しやすい他の文字コードあるいはスペースコードを
用いてもよい。

【００２５】このような認識結果出力処理によって、図
３に示した認識結果は図４に示すようなテキストデータ
に変換され出力される。この認識結果のテキストデータ
をディスプレイ７に出力すれば、図４に示したような文
字列が表示されるので、作業者は、区切り用の括弧によ
って第１候補と下位候補を容易に識別でき、その結果と
して正解文字と削除すべき不要文字とを容易に検索可能
である。そして、区切り用文字及び不要な候補文字にカ
ーソルを移動させ、削除キーを押下する操作を繰り返す
ことによって、容易に認識結果すなわちテキストファイ
ル１４の内容を修正できる。この例では、全ての正解文
字が表示されるので、キーボード８より正解文字を直接
入力する操作は不要である。

【００２６】なお、認識結果出力処理において区切り用
の文字コードを挿入させないことも可能であり、この場
合、ディスプレイ画面には図５に示すように候補文字だ
けが羅列表示される。図５と図４を比較すれば明らかな
ように、区切り用文字が挿入されと、正解文字と不要文
字の検索が面倒になるが、区切り用文字の分だけ削除操
作の回数は減る。したがって、第１候補と第２候補だけ
を出力するような場合には、このような出力方法を採用
できる余地はあろう。

【００２７】実施例２認識結果出力処理のフローを図６に示す。認識結果バッ
ファ１３内の一つの文字画像に対する第１候補文字コー
ドをテキストファイル１４に書き出し（ステップ２０
２）、続いて区切り用のスペースと前括弧のコードを順
に書き出し（ステップ２０４，２０５）、続いて第２候
補文字コードと第３候補文字コードを順に書き出し（ス
テップ２０６）、最後に区切り用の後括弧とスペースの
コードを順に書き出す（ステップ２０８，２０９）。同
様の処理を、認識結果バッファ１３内の最後のデータま
で繰り返す。

【００２８】このような認識結果出力処理によって、図
３に示した認識結果は図７に示すようなテキストデータ
に変換されて出力される。この認識結果を修正する場
合、このデータをディスプレイ７に出力すれば、図７に
示したような文字列が表示される。図７と図４を比較す
れば明かなように、スペースが挿入されたことによっ
て、第１候補と下位候補の識別がさらに容易になる。た
だし、スペースを挿入した分だけ削除操作の回数は増加
する。

【００２９】実施例３認識結果出力処理のフローを図８に示す。認識結果バッ
ファ１３より一つの文字画像に対する第１候補文字コー
ドを取り出してテキストファイル１４に書き出し（ステ
ップ３０２）、次に第１候補文字の辞書との相違度すな
わち距離が０から９までの範囲、１０から１４までの範
囲、１５以上のいずれでか判定する（ステップ３０
６）。

【００３０】距離が０から９までの範囲であれば、この
第１候補の確からしさ（正解である可能性）は十分に高
いので、下位候補文字コードも区切り用文字コードも書
き出さない。

【００３１】第１候補文字の距離が１０から１４までの
範囲であれば、やや確からしさが低いので、区切り用の
前括弧のコードを書き出し（ステップ３０５）、続けて
第２候補文字コードを書き出し（ステップ３０６）、最
後に区切り用の後括弧のコードを書き出す（ステップ３
１０）。

【００３２】第１候補文字の距離が１５以上であれば、
確からしさが低いので、区切り用の前括弧のコードを書
き出し（ステップ３０７）、続けて第２候補文字コード
と第３候補文字コードを順に書き出し（ステップ３０
８）、最後に区切り用の後括弧のコードを書き出す（ス
テップ３１０）。

【００３３】このような認識結果出力処理によって、図
３に示した認識結果は図９に示すようなテキストデータ
に変換されて出力される。この認識結果を修正する場
合、このデータをディスプレイ７に出力すれば、図９に
示したような文字列が表示される。図９と図４または図
７を比較すれば明かなように、出力される下位候補文字
数及び区切り用文字数が減り、しかも正解の可能性のあ
る下位候補文字は出力されるため、修正作業がより容易
になる。

【００３４】なお、第１候補文字の確からしさとして辞
書との相違度（距離）を用いたが、確からしさは他のの
方法により求めてもよい。現在、認識結果の確からしさ
を求める技術はかなり高度化されているため、そのよう
な技術を用いることによって、図９に示した例よりも下
位候補の出力文字数をさらに減らし、修正作業をより容
易化できる可能性がある。

【００３５】また、第１実施例２と同様に区切り用の括
弧の前後にスペースを挿入してもよい。

【００３６】実施例４認識結果出力処理のフローを図１０に示す。認識結果バ
ッファ１３内の一つの文字画像に対する第１候補文字コ
ードを取り出してテキストファイル１４に書き出す（ス
テップ４０２）。次に第２候補文字の辞書との相違度す
なわち距離と、第１候補文字の相違度に５を加えて求め
た閾値と比較する（ステップ４０４）。

【００３７】第２候補文字の距離が閾値以下であれば、
第２候補文字は正解である可能性があるので、区切り用
の前括弧のコードを書き出し（ステップ４０６）、続け
て第２候補文字コードを書き出す（ステップ４０７）。
次に第３候補文字の距離について同様の比較を行ない
（ステップ４０８）、第３候補文字の距離が閾値以下で
あれば、これも正解である可能性があるので、その文字
コードを書き出し（ステップ４０９）、最後に区切り用
の後括弧のコードを書き出す（ステップ４１０）。

【００３８】第２候補文字の距離が閾値を超えるとき
は、第２候補文字が正解である可能性が低く、第３候補
文字が正解である可能性も当然に低いので、いずれの文
字コードも区切り用文字コードも書き出さない。

【００３９】また、第３候補文字の距離が閾値を超える
ときは、その文字コードを書き出さず、直ちに区切り用
の後括弧コードを書き出す（ステップ４１０）。

【００４０】このような認識結果出力処理によって、図
３に示した認識結果は図１１に示すようなテキストデー
タに変換されて出力される。この認識結果を修正する場
合、このデータをディスプレイ７に出力すれば、図１１
に示したような文字列が表示される。図１１と図９を比
較すれば明かなように、出力される下位候補文字数が減
り、しかも正解の可能性のある下位候補文字は出力され
るため、より簡単な効率的修正が可能である。

【００４１】

【発明の効果】以上、詳細に説明したように、請求項１
ないし請求項４の発明によれば、認識結果は第１候補と
第２候補以下の下位候補の文字コードを連続させたテキ
ストデータとして出力されるため、一般的なテキストエ
ディタを用い、不要文字の削除操作のみによる簡単かつ
効率的な認識結果の修正が可能となる。

【００４２】請求項２または請求項３の発明によれば、
正解文字の選択を困難にすることなく、下位候補の出力
文字数を制限することによって、一般的なテキストエデ
ィタを用いた修正がより簡単かつ効率的になる。

【００４３】請求項４の発明によれば、第１候補文字と
下位候補文字の区切りが明確になる結果、正解文字と削
除すべき不要文字の検索が容易になり、修正作業を一層
効率化できる。

【図面の簡単な説明】

【図１】本発明の各実施例に係る文字認識装置の構成の
一例を示すブロック図である。

【図２】認識結果の一例を示す図である。

【図３】実施例１の認識結果出力処理のフロー図であ
る。

【図４】実施例１による認識結果のテキストデータの一
例を示す図である。

【図５】区切り用文字コードの挿入を省いたテキストデ
ータの一例を示す図である。

【図６】実施例２における認識結果出力処理のフロー図
である。

【図７】実施例２による認識結果のテキストデータの一
例を示す図である。

【図８】実施例３における認識結果出力処理のフロー図
である。

【図９】実施例３による認識結果のテキストデータの一
例を示す図である。

【図１０】実施例４における認識結果出力処理のフロー
図である。

【図１１】実施例４による認識結果のテキストデータの
一例を示す図である。

【符号の説明】

１スキャナ２画像メモ
リ３中央演算処理装置（ＣＰＵ）４プログラ
ムメモリ５データメモリ６認識辞書７ディスプレイ８キーボー
ド９ファイル装置１０文字認識
処理プログラム１１認識結果出力処理プログラム１２テキス
トエディタプログラム１３認識結果バッファ１４テキス
トファイル

Claims

【特許請求の範囲】

【請求項１】１個の文字画像に対し認識結果として複
数個の候補文字を得る文字認識装置において、認識結果
を、各文字画像に対する第１候補文字と下位候補文字の
文字コードを連続させたテキストデータとして出力する
手段を有することを特徴とする文字認識装置。
【請求項２】請求項１記載の文字認識装置において、
認識結果を出力する手段は、第１候補文字の確からしさ
に応じて、該第１候補文字に続けて出力する下位候補文
字数を増減させることを特徴とする文字認識装置。
【請求項３】請求項１記載の文字認識装置において、
認識結果を出力する手段は、下位候補文字のうち、その
認識辞書との相違度と、第１候補文字の認識辞書との相
違度との間の差が所定閾値以下の下位候補文字だけを該
第１候補文字に続けて出力することを特徴とする文字認
識装置。
【請求項４】請求項１，２または３記載の文字認識装
置において、認識結果を出力する手段は、認識結果のテ
キストデータに、第１候補文字コードと下位候補文字コ
ードとの区切りのためのスペースや括弧等の特定の文字
コードを挿入することを特徴とする文字認識装置。