JPH0554177A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH0554177A
JPH0554177A JP3235395A JP23539591A JPH0554177A JP H0554177 A JPH0554177 A JP H0554177A JP 3235395 A JP3235395 A JP 3235395A JP 23539591 A JP23539591 A JP 23539591A JP H0554177 A JPH0554177 A JP H0554177A
Authority
JP
Japan
Prior art keywords
character
candidate
recognition result
recognition
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3235395A
Other languages
English (en)
Inventor
Hideaki Yamagata
秀明 山形
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP3235395A priority Critical patent/JPH0554177A/ja
Publication of JPH0554177A publication Critical patent/JPH0554177A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 一般的なテキストエディタを用い、認識結果
を簡単に修正できるようにする。 【構成】 認識結果を、第1候補と下位候補の文字コー
ドを連続させたテキストデータとして出力する。好まし
くは、このテキストデータに第1候補と下位候補の区切
りのための文字コード、例えば括弧のコードを挿入す
る。 【効果】 不要文字の削除操作によって認識結果を修正
できる。区切り用文字によって各文字画像に対する第1
候補文字と下位候補文字との識別が容易になり、正解文
字と削除すべき文字の検索が容易になる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字認識装置に係り、
特に、認識結果の出力方式に関する。
【0002】
【従来の技術】一般的に文字認識によって100パーセ
ントの認識率を達成することは不可能であるため、従来
から、光学的文字認識装置においては人手作業による認
識結果の修正が考慮されている。この認識結果の修正方
式は、専用エディタを用いる方式と、一般的なテキスト
エディタを用いる方式とに大別される。
【0003】専用エディタを用いる方式の装置において
は、例えば認識結果の第1候補文字のみがディスプレイ
画面に表示され、ユーザーがキーボードやマウスによっ
て誤認文字を指定すると、その文字の第2候補以下の候
補文字が表示され、その中からユーザーが正解文字を選
ぶことにより、認識結果が修正される。また、第1候補
文字の表示の際に、認識結果の信頼性に応じて表示色を
変える(特公昭61−6430号)というように、認識
結果として得られた様々な情報を修正の際に利用する技
術も考案されている。
【0004】他方、一般的なテキストエディタを用いる
方式では、認識結果は第1候補文字だけがASCII等
の文字コードデータに変換されてディスプレイ画面に表
示され、誤認文字については、それを削除し、正解文字
コードをキーボードより直接入力するという操作によっ
て修正を行なう。
【0005】
【発明が解決しようとする課題】しかし、専用エディタ
を用いる方式は、次のような欠点がある。まず、通常の
業務でなれた一般的な(汎用の)テキストエディタを用
いることができないため、エディタの操作を学習する必
要があり、習熟するまでは修正効率が悪い。また、第1
候補文字以外の認識結果データも必要であるので、認識
結果は専用のフォーマットで出力されるのが普通である
ため汎用性に欠けるとともに、第1候補文字とそれ以外
の認識結果データが別々のファイルとして出力される場
合には、ファイル数が増え管理が面倒である。
【0006】他方、一般的なテキストエディタを用いる
方式は、通常の業務で使いなれているテキストエディタ
を用いることができるという利点がある。しかし、誤認
文字の修正には、その削除の操作と正解文字コードをキ
ーボード等から直接入力する操作が必要で、修正作業が
煩雑で手間がかかるという欠点がある。
【0007】本発明の目的は、文字認識装置の認識結果
の修正を、一般的な(装置専用でない標準的な)テキス
トエディタを用い簡単な操作のみで可能にすることであ
る。
【0008】
【課題を解決するための手段】請求項1の発明は、1個
の文字画像に対し認識結果として複数個の候補文字を得
る文字認識装置において、認識結果を、各文字画像に対
する第1候補文字と下位候補文字の文字コードを連続さ
せたテキストデータとして出力する手段を有することを
特徴とするものである。
【0009】請求項2の発明は、請求項1の発明の文字
認識装置において、認識結果を出力する手段が、第1候
補文字の確からしさに応じて、該第1候補文字に続けて
出力する下位候補文字数を増減させることを特徴とする
ものである。
【0010】請求項3の発明は、請求項1の発明の文字
認識装置において、認識結果を出力する手段が、下位候
補文字のうち、その認識辞書との相違度と、第1候補文
字の認識辞書との相違度との間の差が所定閾値以下の下
位候補文字だけを該第1候補文字に続けて出力すること
を特徴とするものである。
【0011】請求項4の発明は、請求項1,2または3
の発明の文字認識装置において、認識結果を出力する手
段が、認識結果のテキストデータに、第1候補文字コー
ドと下位候補文字コードとの区切りのためのスペースや
括弧等の特定の文字コードを挿入することを特徴とする
ものである。
【0012】
【作用】請求項1の発明によれば、文字認識装置または
他のコンピュータシステムにおいて、認識結果のテキス
トデータをディスプレイ画面に出力すると、認識対象の
文書等の各文字の第1候補文字と下位候補文字とが連続
して同時に表示されるが、誤認文字の正解文字は下位候
補文字に含まれている場合が多い。したがって、一般的
なテキストエディタを用い、正解文字以外の不要文字を
削除する操作を行なうだけで、認識結果の誤りの殆どを
修正可能である。
【0013】文字認識によって求められる候補文字数が
多い場合、それを全て出力すると、ディスプレイ画面上
で正解文字を探しにくく、また削除しなければならない
文字数が多くなって、効率的な修正が困難になることが
ある。しかし、出力する下位候補文字数を一律に減らす
と、表示された文字中に正解文字が見つからない場合が
増加し、正解文字の入力操作の回数が増加してしまう。
【0014】請求項2の発明によれば、第1候補文字の
確からしさが高く(例えば認識辞書との相違度もしくは
距離が小さい)、それが正解であるか、あるいは比較的
上位の候補文字が正解である可能性が大きいときには、
出力する下位候補文字数を少なくする。逆に、第1候補
文字の確からしさが低く、それが正解である可能性が小
さく、また比較的下位の候補文字が正解文字である可能
性が大きいときには、出力する下位候補文字数を増加さ
せることによって、上に述べたような問題を回避するこ
とができる。
【0015】下位候補文字のうちで、その認識辞書との
相違度が、第1候補文字の認識辞書との相違度に比べあ
る限度以上に大きいものは、正解である可能性がないと
見做して支障がない。請求項3の発明によれば、そのよ
うな正解である可能性がないような下位候補文字を出力
しないようにすることにより、請求項2と同様の効果を
達成できる。
【0016】ディスプレイ画面に認識結果が第1候補文
字と下位候補文字の単に羅列した場合、第1候補文字と
下位候補文字を容易に識別できないため、正解文字と削
除すべき不要文字の検索が必ずしも容易でない。請求項
4の発明によれば、認識結果のテキストデータに第1候
補文字と下位候補文字との区切りのための括弧やスペー
ス等の文字コードが挿入されるので、これをディスプレ
イ画面に表示した場合、第1候補文字と下位候補文字と
がスペースや括弧等で区切られ、その識別が容易になる
ため、区切りのためのスペースや括弧等を余分に削除し
なければならないが、正解文字と削除すべき不要文字の
検索が非常に容易になる。
【0017】
【実施例】以下、図面により本発明の実施例について説
明する。
【0018】図1に本発明の各実施例に係る文字認識装
置の構成の一例を示す。1は文書の画像データを入力す
るスキャナ、2はその画像データを保存する画像メモリ
である。3は各種の処理や制御を実行する中央演算処理
装置(CPU)、4はCPU3のプログラムを格納する
ためのプログラムメモリ、5はCPU3によってワーク
エリアとして利用されるデータメモリ、6は文字認識処
理に用いられる認識辞書、7はディスプレイ、8はキー
ボード、9はハードディスクやフロッピーディスク等の
ファイル装置である。
【0019】プログラムメモリ4はROM領域とRAM
領域があり、ROM領域には文字認識処理プログラム1
0と認識結果出力プログラム11が固定的に格納され
る。プログラムメモリ4のRAM領域には、ファイル装
置8より各種アプリケーションプログラムが必要に応じ
てロードされる。認識結果の修正を行なう場合には、一
般的な(汎用の)テキストエディタプログラム12がロ
ードされる。
【0020】文字認識処理プログラム11がCPU3上
で走ることによって、文字認識処理が実行される。この
文字認識処理の内容は一般的なものでよく、画像メモリ
2内の画像データより文字画像が切り出され、その特徴
量が抽出されて認識辞書6と比較され、認識辞書6との
相違度(特徴量の距離)の小さい順に例えば第3候補ま
での候補文字が求められ、各候補文字とその相違度が認
識結果データとしてデータメモリ5上の認識結果バッフ
ァ13に保存される。認識結果バッファ13内のデータ
フォーマットは任意でよい。なお、ここでは説明を簡略
にするため、認識辞書6との照合によって得られた結果
を最終的な認識結果としているが、この認識結果に対し
て単語照合等の後処理を行ない、その結果を認識結果バ
ッファ13に得てもよいことは当然である。
【0021】この文字認識処理の実行中、あるいは文字
認識処理の終了後に、認識結果処理プログラム11を走
らせることにより、認識結果の出力が可能である。この
認識結果出力処理は以下の各実施例毎に異なるが、基本
的には、認識結果の第1候補文字と下位候補文字の文字
コードを連続させたテキストデータとして出力するもの
で、このテキストデータはデータメモリ5上にテキスト
ファイル14として一時的に保存される。同時に認識結
果の修正を行なう場合、このテキストファイル14の内
容を直ちにディスプレイ7の画面に出力させることがで
きるが、後で修正する場合、あるいは他のコンピュータ
システム上で修正する場合には、ファイル装置9に出力
させることもできる。なお、テキストファイル14のフ
ォーマットは、一般的なテキストエディタによって操作
可能な標準的なもの、例えばMS−DOSフォーマット
とされる。
【0022】当該装置において認識結果の修正作業を行
なう場合、データメモリ5上に認識結果のテキストファ
イル14を置き、その内容をディスプレイ7の画面に表
示させ、テキストエディタプログラム12を走らせる。
作業者は、キーボード8のカーソル移動キーを操作して
画面上のカーソルを不要文字に合わせ削除キーを押下す
る操作の繰り返しによって、殆どの誤認文字を修正する
ことができる。キーボード8による正解文字コードの入
力操作が必要となるのは、画面上に正解文字が見つから
ない場合に限られ、その頻度は少ない。
【0023】次に、図2に示すような認識結果データが
認識結果バッファ13に得られた場合を例にして、各実
施例における認識結果出力処理の内容を説明する。
【0024】実施例1 認識結果出力処理のフローを図3に示す。認識結果バッ
ファ13内の一つの文字画像に対する第1候補文字コー
ドをテキストファイル14に書き出し(ステップ10
2)、これに続けて区切り用の前括弧のコードを書き出
し(ステップ104)、次に第2候補文字コードと第3
候補文字コードを順に書き出し(ステップ106)、最
後に区切り用の後括弧のコードを書き出す(ステップ1
08)。同様のテキストファイル14に対する書き出し
処理を、認識結果バッファ13内の最後のデータまで繰
り返す。ただし、区切り用の文字コードは、候補文字と
区別しやすい他の文字コードあるいはスペースコードを
用いてもよい。
【0025】このような認識結果出力処理によって、図
3に示した認識結果は図4に示すようなテキストデータ
に変換され出力される。この認識結果のテキストデータ
をディスプレイ7に出力すれば、図4に示したような文
字列が表示されるので、作業者は、区切り用の括弧によ
って第1候補と下位候補を容易に識別でき、その結果と
して正解文字と削除すべき不要文字とを容易に検索可能
である。そして、区切り用文字及び不要な候補文字にカ
ーソルを移動させ、削除キーを押下する操作を繰り返す
ことによって、容易に認識結果すなわちテキストファイ
ル14の内容を修正できる。この例では、全ての正解文
字が表示されるので、キーボード8より正解文字を直接
入力する操作は不要である。
【0026】なお、認識結果出力処理において区切り用
の文字コードを挿入させないことも可能であり、この場
合、ディスプレイ画面には図5に示すように候補文字だ
けが羅列表示される。図5と図4を比較すれば明らかな
ように、区切り用文字が挿入されと、正解文字と不要文
字の検索が面倒になるが、区切り用文字の分だけ削除操
作の回数は減る。したがって、第1候補と第2候補だけ
を出力するような場合には、このような出力方法を採用
できる余地はあろう。
【0027】実施例2 認識結果出力処理のフローを図6に示す。認識結果バッ
ファ13内の一つの文字画像に対する第1候補文字コー
ドをテキストファイル14に書き出し(ステップ20
2)、続いて区切り用のスペースと前括弧のコードを順
に書き出し(ステップ204,205)、続いて第2候
補文字コードと第3候補文字コードを順に書き出し(ス
テップ206)、最後に区切り用の後括弧とスペースの
コードを順に書き出す(ステップ208,209)。同
様の処理を、認識結果バッファ13内の最後のデータま
で繰り返す。
【0028】このような認識結果出力処理によって、図
3に示した認識結果は図7に示すようなテキストデータ
に変換されて出力される。この認識結果を修正する場
合、このデータをディスプレイ7に出力すれば、図7に
示したような文字列が表示される。図7と図4を比較す
れば明かなように、スペースが挿入されたことによっ
て、第1候補と下位候補の識別がさらに容易になる。た
だし、スペースを挿入した分だけ削除操作の回数は増加
する。
【0029】実施例3 認識結果出力処理のフローを図8に示す。認識結果バッ
ファ13より一つの文字画像に対する第1候補文字コー
ドを取り出してテキストファイル14に書き出し(ステ
ップ302)、次に第1候補文字の辞書との相違度すな
わち距離が0から9までの範囲、10から14までの範
囲、15以上のいずれでか判定する(ステップ30
6)。
【0030】距離が0から9までの範囲であれば、この
第1候補の確からしさ(正解である可能性)は十分に高
いので、下位候補文字コードも区切り用文字コードも書
き出さない。
【0031】第1候補文字の距離が10から14までの
範囲であれば、やや確からしさが低いので、区切り用の
前括弧のコードを書き出し(ステップ305)、続けて
第2候補文字コードを書き出し(ステップ306)、最
後に区切り用の後括弧のコードを書き出す(ステップ3
10)。
【0032】第1候補文字の距離が15以上であれば、
確からしさが低いので、区切り用の前括弧のコードを書
き出し(ステップ307)、続けて第2候補文字コード
と第3候補文字コードを順に書き出し(ステップ30
8)、最後に区切り用の後括弧のコードを書き出す(ス
テップ310)。
【0033】このような認識結果出力処理によって、図
3に示した認識結果は図9に示すようなテキストデータ
に変換されて出力される。この認識結果を修正する場
合、このデータをディスプレイ7に出力すれば、図9に
示したような文字列が表示される。図9と図4または図
7を比較すれば明かなように、出力される下位候補文字
数及び区切り用文字数が減り、しかも正解の可能性のあ
る下位候補文字は出力されるため、修正作業がより容易
になる。
【0034】なお、第1候補文字の確からしさとして辞
書との相違度(距離)を用いたが、確からしさは他のの
方法により求めてもよい。現在、認識結果の確からしさ
を求める技術はかなり高度化されているため、そのよう
な技術を用いることによって、図9に示した例よりも下
位候補の出力文字数をさらに減らし、修正作業をより容
易化できる可能性がある。
【0035】また、第1実施例2と同様に区切り用の括
弧の前後にスペースを挿入してもよい。
【0036】実施例4 認識結果出力処理のフローを図10に示す。認識結果バ
ッファ13内の一つの文字画像に対する第1候補文字コ
ードを取り出してテキストファイル14に書き出す(ス
テップ402)。次に第2候補文字の辞書との相違度す
なわち距離と、第1候補文字の相違度に5を加えて求め
た閾値と比較する(ステップ404)。
【0037】第2候補文字の距離が閾値以下であれば、
第2候補文字は正解である可能性があるので、区切り用
の前括弧のコードを書き出し(ステップ406)、続け
て第2候補文字コードを書き出す(ステップ407)。
次に第3候補文字の距離について同様の比較を行ない
(ステップ408)、第3候補文字の距離が閾値以下で
あれば、これも正解である可能性があるので、その文字
コードを書き出し(ステップ409)、最後に区切り用
の後括弧のコードを書き出す(ステップ410)。
【0038】第2候補文字の距離が閾値を超えるとき
は、第2候補文字が正解である可能性が低く、第3候補
文字が正解である可能性も当然に低いので、いずれの文
字コードも区切り用文字コードも書き出さない。
【0039】また、第3候補文字の距離が閾値を超える
ときは、その文字コードを書き出さず、直ちに区切り用
の後括弧コードを書き出す(ステップ410)。
【0040】このような認識結果出力処理によって、図
3に示した認識結果は図11に示すようなテキストデー
タに変換されて出力される。この認識結果を修正する場
合、このデータをディスプレイ7に出力すれば、図11
に示したような文字列が表示される。図11と図9を比
較すれば明かなように、出力される下位候補文字数が減
り、しかも正解の可能性のある下位候補文字は出力され
るため、より簡単な効率的修正が可能である。
【0041】
【発明の効果】以上、詳細に説明したように、請求項1
ないし請求項4の発明によれば、認識結果は第1候補と
第2候補以下の下位候補の文字コードを連続させたテキ
ストデータとして出力されるため、一般的なテキストエ
ディタを用い、不要文字の削除操作のみによる簡単かつ
効率的な認識結果の修正が可能となる。
【0042】請求項2または請求項3の発明によれば、
正解文字の選択を困難にすることなく、下位候補の出力
文字数を制限することによって、一般的なテキストエデ
ィタを用いた修正がより簡単かつ効率的になる。
【0043】請求項4の発明によれば、第1候補文字と
下位候補文字の区切りが明確になる結果、正解文字と削
除すべき不要文字の検索が容易になり、修正作業を一層
効率化できる。
【図面の簡単な説明】
【図1】本発明の各実施例に係る文字認識装置の構成の
一例を示すブロック図である。
【図2】認識結果の一例を示す図である。
【図3】実施例1の認識結果出力処理のフロー図であ
る。
【図4】実施例1による認識結果のテキストデータの一
例を示す図である。
【図5】区切り用文字コードの挿入を省いたテキストデ
ータの一例を示す図である。
【図6】実施例2における認識結果出力処理のフロー図
である。
【図7】実施例2による認識結果のテキストデータの一
例を示す図である。
【図8】実施例3における認識結果出力処理のフロー図
である。
【図9】実施例3による認識結果のテキストデータの一
例を示す図である。
【図10】実施例4における認識結果出力処理のフロー
図である。
【図11】実施例4による認識結果のテキストデータの
一例を示す図である。
【符号の説明】
1 スキャナ 2 画像メモ
リ 3 中央演算処理装置(CPU) 4 プログラ
ムメモリ 5 データメモリ 6 認識辞書 7 ディスプレイ 8 キーボー
ド 9 ファイル装置 10 文字認識
処理プログラム 11 認識結果出力処理プログラム 12 テキス
トエディタプログラム 13 認識結果バッファ 14 テキス
トファイル

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 1個の文字画像に対し認識結果として複
    数個の候補文字を得る文字認識装置において、認識結果
    を、各文字画像に対する第1候補文字と下位候補文字の
    文字コードを連続させたテキストデータとして出力する
    手段を有することを特徴とする文字認識装置。
  2. 【請求項2】 請求項1記載の文字認識装置において、
    認識結果を出力する手段は、第1候補文字の確からしさ
    に応じて、該第1候補文字に続けて出力する下位候補文
    字数を増減させることを特徴とする文字認識装置。
  3. 【請求項3】 請求項1記載の文字認識装置において、
    認識結果を出力する手段は、下位候補文字のうち、その
    認識辞書との相違度と、第1候補文字の認識辞書との相
    違度との間の差が所定閾値以下の下位候補文字だけを該
    第1候補文字に続けて出力することを特徴とする文字認
    識装置。
  4. 【請求項4】 請求項1,2または3記載の文字認識装
    置において、認識結果を出力する手段は、認識結果のテ
    キストデータに、第1候補文字コードと下位候補文字コ
    ードとの区切りのためのスペースや括弧等の特定の文字
    コードを挿入することを特徴とする文字認識装置。
JP3235395A 1991-08-22 1991-08-22 文字認識装置 Pending JPH0554177A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3235395A JPH0554177A (ja) 1991-08-22 1991-08-22 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3235395A JPH0554177A (ja) 1991-08-22 1991-08-22 文字認識装置

Publications (1)

Publication Number Publication Date
JPH0554177A true JPH0554177A (ja) 1993-03-05

Family

ID=16985458

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3235395A Pending JPH0554177A (ja) 1991-08-22 1991-08-22 文字認識装置

Country Status (1)

Country Link
JP (1) JPH0554177A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8363963B2 (en) 2008-12-17 2013-01-29 Sharp Kabushiki Kaisha Apparatus, method and computer readable medium that associates a plurality of possible word recognition results with an image

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8363963B2 (en) 2008-12-17 2013-01-29 Sharp Kabushiki Kaisha Apparatus, method and computer readable medium that associates a plurality of possible word recognition results with an image

Similar Documents

Publication Publication Date Title
US7802184B1 (en) Method and apparatus for processing text and character data
JP3689455B2 (ja) 情報処理方法及び装置
EP1687807B1 (en) Topic specific models for text formatting and speech recognition
US7610193B2 (en) Document based character ambiguity resolution
JP2726568B2 (ja) 文字認識方法及び装置
JP2991178B2 (ja) 音声ワープロ
US6754386B1 (en) Method and system of matching ink processor and recognizer word breaks
CN112765963A (zh) 语句分词方法、装置、计算机设备及存储介质
US6470362B1 (en) Extracting ordered list of words from documents comprising text and code fragments, without interpreting the code fragments
CN104731766A (zh) 拼音文字词库构建方法和装置及输入方法和系统
JPH0554177A (ja) 文字認識装置
JP6131765B2 (ja) 情報処理装置及び情報処理プログラム
CN112905733A (zh) 一种基于ocr识别技术的图书保存方法、系统及装置
JPH10187751A (ja) 認識データ処理装置およびそのプログラム記録媒体
JPH0619962A (ja) テキスト分割装置
JP2003331214A (ja) 文字認識誤り訂正方法、装置及びプログラム
US20040205666A1 (en) System and method for anticipated file editing
JP2002099555A (ja) 文書分類装置及び文書分類方法
JP2005293440A (ja) 文字コード変換方法および文字コード変換機能付コンピュータと文字コード変換用プログラム
CN114997138B (zh) 一种化学品说明书解析方法、装置、设备及可读存储介质
JPH08190561A (ja) 文書修正装置
JP2006343932A (ja) 情報検索システム及び検索方法
JP3831392B2 (ja) 言語知識獲得プログラム
JPH06251187A (ja) 文字認識誤り修正方法及び装置
JP4310741B2 (ja) 文字コードのデータ処理方法、装置及びプログラム

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040302