JP2000123116A - 文字認識結果修正方法 - Google Patents

文字認識結果修正方法

Info

Publication number
JP2000123116A
JP2000123116A JP10309451A JP30945198A JP2000123116A JP 2000123116 A JP2000123116 A JP 2000123116A JP 10309451 A JP10309451 A JP 10309451A JP 30945198 A JP30945198 A JP 30945198A JP 2000123116 A JP2000123116 A JP 2000123116A
Authority
JP
Japan
Prior art keywords
character
recognition result
correction
corrected
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10309451A
Other languages
English (en)
Inventor
Keiji Kojima
啓嗣 小島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP10309451A priority Critical patent/JP2000123116A/ja
Publication of JP2000123116A publication Critical patent/JP2000123116A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 修正作業を大幅に削減することができる文字
認識結果修正方法を提供する。 【解決手段】 原稿上の文字をイメージ情報(画像情
報)(G)として入力して文字認識を行った際の認識結
果を修正する文字認識結果修正方法において、認識結果
情報(R)を構成しているテキスト(文章)を認識結果
修正画面(D)として表示して手動修正させ、その修正
の際の修正前後の文字列および修正回数を修正情報とし
て記憶し、その後の認識結果修正の際、当該認識対象文
字が上記修正情報として記憶されている場合、その修正
回数が所定回数以上のとき、当該認識結果候補文字(L
2)などに修正情報として記憶されている修正後の文字
をその筆頭に追加し、文字認識結果を自動修正する(S
5)方法にした。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、原稿上の文字を画
像情報として入力して文字認識を行った際の認識結果を
修正する文字認識結果修正方法に係わり、特に、修正作
業を削減することができる文字認識結果修正方法に関す
る。
【0002】
【従来の技術】従来の文字認識装置においては、文字を
認識する際に、予め用意しておいた文字辞書の各文字と
入力文字とを比較し、一致度の最も高い文字を認識結果
としている。しかし、この認識結果は必ずしも正しいと
は限らないので、その後、認識結果としてのテキスト
(文章)を表示装置に表示し、誤って認識された文字を
画面上で修正することが多い。つまり、画面上で修正対
象文字が指示されると、上記文字を認識結果とした認識
時に一致度が比較的高かった複数の文字を次位候補文字
として表示し、そのなかに正解文字があればその文字を
選択させ、なければ、例えば、かな漢字変換方式などに
よりキーボードから正解文字を入力させる。しかし、文
字認識を行う原稿の量が多くなると、誤り修正に要する
時間は長時間に及んでしまう。そのため、特開平7−1
21653号公報に示された文字認識装置の文字訂正方
法では、認識結果文字を正解文字に修正したときの修正
内容を記憶しておき、その後の文字修正の際、修正対象
文字が以前に修正されたことがあるか否かを判定し、修
正されたことがある場合には、複数の次位候補文字を表
示する際、以前に正解とされて記憶されている上記正解
文字を点滅表示させたり、筆頭に表示させて作業効率の
向上を図っている。
【0003】
【発明が解決しようとする課題】しかしながら、特開平
7−121653号公報に示された上記の従来技術で
は、修正結果を反映させた自動修正を行っていないの
で、修正作業の削減も微々たるレベルに止まらざるを得
ない。本発明の課題は、上記のような従来技術の問題を
解決し、修正作業を大幅に削減することができる文字認
識結果修正方法を提供することにある。
【0004】
【課題を解決するための手段】上記の課題を解決するた
めに、請求項1記載の発明では、原稿上の文字を画像情
報として入力して文字認識を行った際の認識結果を修正
する文字認識結果修正方法において、文字認識結果を表
示して手動修正させ、その修正の際の修正情報を記憶
し、その後の認識結果修正の際、記憶した上記修正情報
に基づいて文字認識結果を自動修正する方法にした。ま
た、請求項2記載の発明では、上記において、修正前後
の文字列とそれぞれの文字列の修正回数とを修正情報と
した。また、請求項3記載の発明では、上記において、
その後の手動修正の際、修正対象とされた文字を含む文
字列が修正情報として記憶されている文字列の場合、上
記文字の認識結果候補文字の上位に修正後の文字を追加
する方法にした。また、請求項4記載の発明では、請求
項2記載の発明において、その後の認識結果修正の際、
当該文字の修正回数が多い場合、当該認識結果候補文字
の筆頭に当該文字の修正後の文字を追加して言語処理を
行い、自動修正する方法にした。また、請求項5記載の
発明では、請求項1の文字認識結果修正方法において、
修正前後の文字列とそれぞれの文字列の修正回数と確か
らしさとを修正情報とした。また、請求項6記載の発明
では、上記において、その後の認識結果修正の際、当該
文字の修正回数が多く、且つ当該認識結果候補文字の確
からしさが低い場合、当該認識結果候補文字の筆頭に修
正後の文字を追加して言語処理を行い、自動修正する方
法にした。
【0005】
【作用】上記のような手段にしたので、請求項1記載の
発明では、文字認識結果を手動修正した際の修正情報が
記憶され、その後の認識結果修正の際、記憶した上記修
正情報に基づいて文字認識結果が自動修正される。請求
項2記載の発明では、請求項1記載の発明において、修
正前後の文字列とそれぞれの文字列の修正回数とが修正
情報として記憶される。請求項3記載の発明では、請求
項2記載の発明において、その後の手動修正の際、修正
対象とされた文字を含む文字列が修正情報として記憶さ
れている文字列の場合、上記文字の認識結果候補の上位
に修正後の文字が追加される。請求項4記載の発明で
は、請求項2記載の発明において、その後の認識結果修
正の際、当該文字の修正回数が多い場合、当該認識結果
候補文字の筆頭に修正後の文字を追加して言語処理が行
われ、自動修正される。請求項5記載の発明では、請求
項1記載の発明において、修正前後の文字列とそれぞれ
の文字列の修正回数と確からしさとが修正情報として記
憶される。請求項6記載の発明では、請求項5記載の発
明において、その後の認識結果修正の際、当該文字の修
正回数が多く、且つ当該認識結果候補文字の確からしさ
が低い場合、当該認識結果候補文字の筆頭に修正後の文
字を追加して言語処理が行われ、自動修正される。
【0006】
【発明の実施の形態】以下、図面により本発明の実施の
形態を詳細に説明する。図7は本発明が実施される文字
認識装置の構成ブロック図である。図示したように、こ
の実施例の文字認識装置は、本発明に係わる文字認識お
よび認識結果修正プログラムなどを内蔵したプログラム
メモリ1、上記プログラムに従って動作する中央演算処
理装置(以下、CPUと称す)2、文字認識などのため
の辞書情報を記憶する辞書メモリ3、文字認識結果を手
動修正した際に得られた修正情報などを記憶しておく修
正情報メモリ4、一時的に各種データを記憶するワーク
エリアRAM5、原稿上の文字を画像情報として読み取
るスキャナ6、ディスプレイ装置、キーボード、マウス
などから成る操作表示部7などを備えている。なお、上
記辞書メモリ3および修正情報メモリ4は例えば共通の
ハードディスクで構成する。図1は、上記のような構成
の文字認識装置を用いて行われる本発明の文字認識方法
および文字認識結果修正方法の説明図である。図示した
ように、この文字認識方法は行切り出し処理(S1)、
文字切り出し処理(S2)、認識処理(S3)、言語処
理を含む後処理(S4)などから構成され、画像(イメ
ージ)情報Gとしての文字を入力し、確からしい順(確
信度順)に並んだ認識結果候補文字など認識結果情報R
を出力する。その後、アプリケーションプログラムに従
って表示される認識結果修正画面Dにより文字認識結果
の出力である文字の誤りを見つけ、上記文字に対応した
認識結果候補文字のなかから正解文字を選択するか、か
な漢字変換方式などによりキーボードから文字入力する
かして、認識結果を手動修正する。上記の処理におい
て、本発明では、認識結果の修正時に、どの文字をどの
文字に何回修正したかという修正情報を記憶手段に記憶
し、その後に行われる認識結果の手動修正に利用する。
つまり、当該候補文字の上位に修正後の文字を追加する
のである。また、上記修正情報を、その後に行われる文
字認識時の自動修正にも利用する。つまり、認識処理で
出力される認識結果候補文字L1、L2に、対応した修
正後の文字を追加し、再び言語処理を行うのである(S
5)。
【0007】以下、図2に示す手動修正時の動作フロ
ー、および図3に示す文字認識・自動修正時の動作フロ
ーなどに従って、第1の実施例の動作を説明する。ま
ず、認識結果修正画面D上での誤り文字の手動修正であ
るが、例えば、スキャナ6により読み取った図4(a)
に示すような原稿の文字認識を行ったとき、図4(b)
に示すような認識結果修正画面Dが出力されたとする。
つまり、「人間」を2箇所で「人問」と誤認識し、
「間」を1箇所で「問」と誤認識し、「関して」を1箇
所で「聞して」と誤認識している。利用者は上記のよう
な認識結果修正画面Dを見て、まず、修正する最初の文
字にカーソルを合わせる(S11)。そうすると、CP
U2は修正情報メモリ4から既にワークエリアRAM5
にロードされている以前の修正情報を参照し、カーソル
位置の文字が以前に修正した文字か否かを判定する(S
12)。なお、最初に行われる手動修正では修正情報が
記憶されていないので、カーソル位置の文字は以前に修
正した文字でないと判定される(S12でNO)。修正
情報が記憶されていない場合、または当該文字について
修正情報が記憶されていない場合(S12でNO)、C
PU2は、認識結果情報Rを構成する情報として、表示
されている個々の文字に対応付けて与えられている認識
結果候補文字のなかから当該認識結果候補文字をそのま
ま(文字追加を行うことなく)表示させる。そして、利
用者が、その中の一つの文字を選択するか、キーボード
から文字入力を行うと、CPU2はその文字を取得し、
カーソル位置の文字をその文字に置換して修正する(S
14)。また、CPU2は修正前後の文字列から成る修
正情報を作成し、その修正情報をワークエリアRAM5
の所定領域に記憶させる(S15)。続いて、例えば認
識結果修正画面D(例えば1ページ分)内のすべての誤
り文字の修正が終了したか否かを利用者に指示させ(S
16)、終了していなければ(S16でNO)、ステッ
プS11からくり返す。こうして、1ページ目のテキス
ト(原稿)を修正し終わった時点では、図5に示すよう
な修正情報が作成され、記憶される。単に、修正前後の
文字列(単語)だけでなく、その文字列の修正回数も記
憶されるのである。2ページ目以降は、この修正情報が
手動修正および文字認識時の自動修正で利用される。
【0008】図2に示したステップS12において、以
前に修正した文字列であると判定される(S12でYE
S)のは、上記したように、例えば一つの原稿の2ペー
ジ以降であり、カーソルが「人問」の「問」に合わせら
れたとき、修正情報として、修正前文字列「人問」が記
憶されていると、CPU2は認識結果情報Rとして与え
られた「問」の認識結果候補文字の一つとして「間」を
その筆頭に追加して表示させる。あるいは、与えられた
認識結果候補文字中の筆頭でない位置に「間」を含んで
いる場合は、筆頭位置に修正して表示させる(S1
3)。したがって、利用者がキーボードから文字入力を
行わねばならないような事態が減少するし、正解文字が
筆頭に位置することが多くなるので、操作性が向上す
る。また、文字認識時には、スキャナ6が原稿上の文字
を読み取り、読み取られた画像情報がワークエリアRA
M5に格納されると、CPU2は上記画像情報の第1行
から順に行切り出しを行う(S21)。例えば横書きの
場合、行間は数ラインに亘って主走査方向(横方向)に
「白」画素が連なるので、このような特性を利用して行
切り出しを行うのである。続いて、文字切り出しを行う
(S22)。1行中の文字間は副走査方向(縦方向)に
数ラインに亘って「白」画素が連なるので、ここでは、
このような特性を利用する。一つの文字が切り出される
と、CPU2は、辞書メモリ3を参照して当業者には公
知の方法で当該文字の文字認識を行う(S23)。そし
て、確からしさ(確信度、一致度)の高い順に1個また
は複数の認識結果候補文字L1(図1参照)を選び出す
(図1に示したように、この認識結果候補文字に修正情
報に基づいた文字追加を行ってもよい)。
【0009】次に、言語処理を含む後処理を行う(S2
4)。言語処理では、活用形も含めて、そのような単語
が登録されているか否かなどを判定し、その他、「、」
「。」の位置が正しいか否かを判定したり、英字であれ
ば、大文字の位置が正しいか否かなどを判定するのであ
る。こうして、認識結果候補文字L1が見直され、一部の
文字をふるい落としたり、確からしさの順番を入れ替え
たりした新たな認識結果候補文字L2が得られる。ここ
で、CPU2は当該文字を修正した当該文字列が修正情
報として記憶されているか否かを判定する(S25)。
そして、そのような文字列が記憶されていると(S25
でYES)、その修正回数が所定回数以上か否かを判定
し(S26)、所定回数以上であれば(S26でYE
S)、当該修正情報中の修正後の文字を認識結果候補文
字の筆頭位置に追加する。あるいは、得られた認識結果
候補文字L2中の筆頭でない位置に上記修正後の文字を含
んでいる場合、筆頭位置に修正する(S27)。この
後、変更された認識結果候補文字について再び言語処理
をくり返し(S28)、テキストとして出力する認識結
果が自動修正され、修正結果が記憶される。つまり、こ
の言語処理による見直しで、追加した文字が筆頭位置か
ら下ろされなければ、出力されるテキスト(文章)には
追加した文字が記載されることになる。なお、ステップ
S25において当該文字列が修正されていないと判定さ
れた場合(S25でNO)、および修正されたことはあ
るがその修正回数は所定回数より少ないと判定された場
合は(S26でNO)、認識結果の自動修正は行わな
い。こうして、1行のすべての文字について文字認識・
自動修正が終了し、次の行があれば(S29でNO)、
ステップS21からくり返す。このようにして、本発明
の第1の実施例によれば、類似の文字誤認識の修正が自
動的に行われるので、文字認識結果の修正作業が大幅に
削減される。
【0010】図6は本発明の第2の実施例を示す文字認
識時の動作フロー図である。図示したように、この実施
例の動作は、図3に示した第1の実施例の動作に対し
て、ステップS37の判定動作が加わっただけである。
つまり、この実施例では、当該文字列の修正回数が多い
というだけでなく、認識結果候補文字として上がってい
る文字の確からしさ(確信度)が低い場合に(S37で
YES)、以前に修正した修正後の文字を認識結果候補
文字の筆頭に追加するのである(S38)。こうして、
この実施例によれば、確からしさの高い認識結果候補文
字が正解文字として採用されないということによる悪影
響を防ぐことができる。
【0011】
【発明の効果】以上説明したように、本発明によれば、
請求項1記載の発明では、文字認識結果を手動修正した
際の修正情報が記憶され、その後の認識結果修正の際、
記憶した上記修正情報に基づいて文字認識結果が自動修
正されるので、文字認識結果の修正作業が大幅に削減さ
れる。また、請求項2記載の発明では、請求項1記載の
発明において、修正前後の文字列とそれぞれの文字列の
修正回数とが修正情報として記憶されるので、単に文字
列だけを修正情報にする場合に比べて自動修正の精度が
向上する。また、請求項3記載の発明では、請求項2記
載の発明において、その後の手動修正の際、修正対象と
された文字を含む文字列が修正情報として記憶されてい
る文字列の場合、上記文字の認識結果候補の上位に修正
後の文字が追加されるので、手動修正の作業量が減るだ
けでなく、手動修正の作業効率も向上する。また、請求
項4記載の発明では、請求項2記載の発明において、そ
の後の認識結果修正の際、当該文字の修正回数が多い場
合、当該認識結果候補文字の筆頭に修正後の文字を追加
して言語処理が行われ、自動修正されるので、単に文字
列だけを修正情報にする場合に比べて自動修正の精度が
向上するし、処理方法も簡単である。また、請求項5記
載の発明では、請求項1記載の発明において、修正前後
の文字列とそれぞれの文字列の修正回数と確からしさと
が修正情報として記憶されるので、自動修正の精度がさ
らに向上する。また、請求項6記載の発明では、請求項
5記載の発明において、その後の認識結果修正の際、当
該文字の修正回数が多く、且つ当該認識結果候補文字の
確からしさが低い場合、当該認識結果候補文字の筆頭に
修正後の文字を追加して言語処理が行われ、自動修正さ
れるので、自動修正の悪影響を防ぐことができる。
【図面の簡単な説明】
【図1】本発明の各実施例の文字認識結果修正方法など
の説明図である。
【図2】本発明の第1の実施例を示す文字認識結果修正
方法の動作フロー図である。
【図3】本発明の第1の実施例を示す文字認識結果修正
方法の他の動作フロー図である。
【図4】(a)(b)は本発明の第1の実施例を示す文字認識
結果修正方法の説明図である。
【図5】本発明の第1の実施例を示す文字認識結果修正
方法の他の説明図である。
【図6】本発明の第2の実施例を示す文字認識結果修正
方法の動作フロー図である。
【図7】本発明が実施される文字認識装置の構成ブロッ
ク図である。
【符号の説明】
1 プログラムメモリ 2 中央演算処理装置 3 辞書メモリ 4 修正情報メモリ 5 ワークエリアRAM 6 スキャナ

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 原稿上の文字を画像情報として入力して
    文字認識を行った際の認識結果を修正する文字認識結果
    修正方法において、文字認識結果を表示して手動修正さ
    せ、その修正の際の修正情報を記憶し、その後の認識結
    果修正の際、記憶した上記修正情報に基づいて文字認識
    結果を自動修正することを特徴とする文字認識結果修正
    方法。
  2. 【請求項2】 請求項1の文字認識結果修正方法におい
    て、修正前後の文字列とそれぞれの文字列の修正回数と
    を修正情報としたことを特徴とする文字認識結果修正方
    法。
  3. 【請求項3】 請求項2の文字認識結果修正方法におい
    て、その後の手動修正の際、修正対象とされた文字を含
    む文字列が修正情報として記憶されている文字列の場
    合、上記文字の認識結果候補文字の上位に修正後の文字
    を追加することを特徴とする文字認識結果修正方法。
  4. 【請求項4】 請求項2の文字認識結果修正方法におい
    て、その後の認識結果修正の際、当該文字の修正回数が
    多い場合、当該認識結果候補文字の筆頭に当該文字の修
    正後の文字を追加して言語処理を行い、自動修正するこ
    とを特徴とする文字認識結果修正方法。
  5. 【請求項5】 請求項1の文字認識結果修正方法におい
    て、修正前後の文字列とそれぞれの文字列の修正回数と
    確からしさとを修正情報としたことを特徴とする文字認
    識結果修正方法。
  6. 【請求項6】 請求項5の文字認識結果修正方法におい
    て、その後の認識結果修正の際、当該文字の修正回数が
    多く、且つ当該認識結果候補文字の確からしさが低い場
    合、当該認識結果候補文字の筆頭に修正後の文字を追加
    して言語処理を行い、自動修正することを特徴とする文
    字認識結果修正方法。
JP10309451A 1998-10-15 1998-10-15 文字認識結果修正方法 Pending JP2000123116A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10309451A JP2000123116A (ja) 1998-10-15 1998-10-15 文字認識結果修正方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10309451A JP2000123116A (ja) 1998-10-15 1998-10-15 文字認識結果修正方法

Publications (1)

Publication Number Publication Date
JP2000123116A true JP2000123116A (ja) 2000-04-28

Family

ID=17993162

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10309451A Pending JP2000123116A (ja) 1998-10-15 1998-10-15 文字認識結果修正方法

Country Status (1)

Country Link
JP (1) JP2000123116A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008052439A (ja) * 2006-08-23 2008-03-06 Fuji Xerox Co Ltd 画像処理システムおよび画像処理プログラム
JP2016095662A (ja) * 2014-11-13 2016-05-26 株式会社プリマジェスト 情報処理装置及び情報処理方法
JP2020135610A (ja) * 2019-02-22 2020-08-31 株式会社Pfu 情報処理装置、情報処理方法、及びプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008052439A (ja) * 2006-08-23 2008-03-06 Fuji Xerox Co Ltd 画像処理システムおよび画像処理プログラム
JP2016095662A (ja) * 2014-11-13 2016-05-26 株式会社プリマジェスト 情報処理装置及び情報処理方法
JP2020135610A (ja) * 2019-02-22 2020-08-31 株式会社Pfu 情報処理装置、情報処理方法、及びプログラム
JP7378939B2 (ja) 2019-02-22 2023-11-14 株式会社Pfu 情報処理装置、情報処理方法、及びプログラム

Similar Documents

Publication Publication Date Title
JP4071328B2 (ja) 文書画像処理装置および方法
US7106905B2 (en) Systems and methods for processing text-based electronic documents
JPH05151254A (ja) 文書処理方法およびシステム
JP2000123116A (ja) 文字認識結果修正方法
JP4633773B2 (ja) 文書画像処理装置および方法
JPH01292586A (ja) 文字認識支援装置
JPH06251187A (ja) 文字認識誤り修正方法及び装置
JP4589370B2 (ja) 文書画像処理装置および方法
JP2890788B2 (ja) 文書認識装置
JPH06348889A (ja) 文字認識装置
JPH06333083A (ja) 光学式文字読取装置
JP2006178543A (ja) 画像処理方法、画像処理装置
JPH11203400A (ja) 文字入力装置および文字入力方法,並びに文字入力方法をコンピュータに実行させるプログラムを記録した機械読み取り可能な記録媒体
JPH08293033A (ja) 情報処理装置
JP2874815B2 (ja) 日本語文字読取装置
JPH07182344A (ja) 機械翻訳装置
JPH06101002B2 (ja) 文章作成装置
JPH0981672A (ja) 文書読取装置
JPH1055405A (ja) 住所録読み取り装置及び住所録読み取り方法
JPH0636067A (ja) 文字読取装置
JPS6321170A (ja) 文書処理方法
JP2000112955A (ja) 画像表示方法および画像ファイリング装置および記録媒体
JPS6321171A (ja) 文書処理装置
JPH04293185A (ja) ファイリング装置
JP2005267394A (ja) 情報処理装置および領域変更方法およびプログラムおよび記録媒体