JPH11102412A - ビットマップ選択を用いて光学式文字認識の訂正を行うための方法および装置、並びに、ocr出力の誤りを訂正するために一連の命令を記録したコンピュータ読み取り可能な記録媒体 - Google Patents

ビットマップ選択を用いて光学式文字認識の訂正を行うための方法および装置、並びに、ocr出力の誤りを訂正するために一連の命令を記録したコンピュータ読み取り可能な記録媒体

Info

Publication number
JPH11102412A
JPH11102412A JP10110881A JP11088198A JPH11102412A JP H11102412 A JPH11102412 A JP H11102412A JP 10110881 A JP10110881 A JP 10110881A JP 11088198 A JP11088198 A JP 11088198A JP H11102412 A JPH11102412 A JP H11102412A
Authority
JP
Japan
Prior art keywords
text
document
document image
displaying
replacement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10110881A
Other languages
English (en)
Inventor
J Mcnaney Michael
ジェイ.マキナニー マイケル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KURARITEC CORP
Original Assignee
KURARITEC CORP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KURARITEC CORP filed Critical KURARITEC CORP
Publication of JPH11102412A publication Critical patent/JPH11102412A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02KDYNAMO-ELECTRIC MACHINES
    • H02K9/00Arrangements for cooling or ventilating
    • H02K9/08Arrangements for cooling or ventilating by gaseous cooling medium circulating wholly within the machine casing
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02KDYNAMO-ELECTRIC MACHINES
    • H02K1/00Details of the magnetic circuit
    • H02K1/06Details of the magnetic circuit characterised by the shape, form or construction
    • H02K1/12Stationary parts of the magnetic circuit
    • H02K1/20Stationary parts of the magnetic circuit with channels or ducts for flow of cooling medium

Landscapes

  • Engineering & Computer Science (AREA)
  • Power Engineering (AREA)
  • Character Discrimination (AREA)
  • Motor Or Generator Cooling System (AREA)

Abstract

(57)【要約】 【課題】 元のテキストをOCR出力のテキストに変換
している間に起こった間違いを正す際に、ユーザが元の
紙の文書を見なくても済むとともに、可能な訂正内容が
自動的に生成され、それによってユーザが訂正を容易に
行うことができるようにすること。 【解決手段】 光学式文字認識(OCR)出力の元とな
る文書イメージが表示されるため、ユーザは表示された
文書イメージのある領域を選択することができる。領域
が選択されると、その選択された領域に対応するOCR
出力のテキストは、自動的に生成されてなる、そのテキ
ストに対する可能性のあるテキストの組と一緒にポップ
アップメニュー内に表示される。ユーザは、ポップアッ
プメニュー内の置換えテキストの一つを選択するかまた
はキーをたたいて訂正をすることによってOCR出力内
のテキストを置き換えることができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、光学式文字認識に
関し、特に光学式文字認識出力の誤りを訂正するための
方法および装置、並びに、並びに、OCR出力の誤りを
訂正するために一連の命令を記録したコンピュータ読み
取り可能な記録媒体に関する。
【0002】
【従来の技術】紙の書類からテキストおよびグラフィッ
クを取得することは、多くの産業にとって重大な問題で
ある。例えば出版会社は年間を通じて何百または何千の
学術論文を印刷するかもしれない。しばしば出版会社は
紙の文書から作業を始め、その紙の文書は出版会社のコ
ンピュータ装置に入力されなければならない。従来の一
手法は、紙の文書を読んでその文書をコンピュータシス
テムにタイプ入力するために、キーボード入力者を雇う
というものである。しかしながら文書を入力することは
時間を浪費し、かつコストも高い。
【0003】光学式文字認識(以下、OCRとする)
は、出版産業およびその他の産業にとって有益であるこ
とを保証する技術である。その理由は、OCR装置の入
力処理速度はキーボード入力者の入力速度をはるかに上
回っているからである。従って出版会社の従業員は、一
般に読取り走査された文書から作業を始める。その文書
はOCR装置によってコンピュータの読込み可能なテキ
ストフォーマット、例えばASCIIに変換されてい
る。
【0004】しかしながら最近のOCR装置でもって可
能な高い認識率(しばしば95%を越える)ですら、高
い正確度を必要とする出版産業のような産業にとっては
十分でない。従って出版会社は校正係の人を雇い、手作
業でOCR出力の修正を行う。
【0005】
【発明が解決しようとする課題】しかしながらOCR出
力を手作業で校正することは、非常に時間を浪費し、ま
た人が行うのは困難である。校正係の人は、元の紙の文
書とOCR出力の印刷またはスクリーン表示とを見比べ
てそれらを一語一語比較しなければならない。たとえ認
識率が高くても、人がOCR出力の校正を行うと一人よ
がりになって誤りを見落としがちである。
【0006】別の従来の選択は、結果として生じたコン
ピュータの読込み可能なテキストのスペルチェックを行
うことである。しかしながらスペルの間違った語すべて
を認識するというわけではない。加えて、入力された語
は非常に曲解されているかもしれないので、校正係はス
ペルチェックを行っている間中ずっと紙のテキストに戻
って参照しなければならない。一旦校正をする人は紙の
テキストを見て正しい語を決め、その正しい語をOCR
出力のテキストにキーをたたいて入力する。この手法は
時間を浪費し、またやや間違いがちであることが分かっ
ている。
【0007】本発明の目的は、元のテキストをOCR出
力のテキストに変換している間に起こった間違いを正す
際に、ユーザが元の紙の文書を見なくても済むととも
に、可能な訂正内容が自動的に生成され、それによって
ユーザが訂正を容易に行うことができるようにすること
である。
【0008】
【課題を解決するための手段】人がOCR出力を校正し
訂正することを容易に行えるようにする必要がある。特
にOCR出力を校正して訂正されたテキストの正確さを
向上させるのに費やされる時間を減らす必要がある。
【0009】これらおよび他の必要性は、本発明によっ
てうまく処理される。元の紙の文書から得られた文書イ
メージの文字は、文書テキストを生成するために(例え
ばOCRを介して)認識される。文書テキストの語に対
応する文書イメージの領域が決定される。文書イメージ
が表示され、それによってユーザは文書イメージ上のあ
る位置を選択することができる。文書イメージ内のその
位置を含む文書領域に対応する、文書テキストから抽出
されてなるテキスト(例えば語または句)が決定され、
表示され、好ましくはポップアップメニュー内に表示さ
れる。ユーザは選択されたテキストを置換えテキストで
置き換えることができる。
【0010】好ましくは、選択されたテキストに基づい
て1または2以上の可能性のある置換えテキストが自動
的に生成されてポップアップメニュー内に表示される。
ユーザは選択されたテキストを置き換えるために、表示
された置換えテキストのうちの一つを選択することがで
きる。あるいは、ユーザは置換え語をキーをたたいて入
力することができる。一例においては、認識確度パラメ
ータが決定され、文字認識によって誤認識されるおそれ
のある語を強調して誤認識されていそうな文書テキスト
の部分に校正者の注意を向けるのに使用される。
【0011】文書イメージを表示することによって、ユ
ーザは、紙の元の文書をOCR出力と比較するのに関す
る時間を節約する。さらには、誤りを訂正するのに要す
る時間は、可能な訂正内容を自動的に生成してユーザが
ポップアップメニュー内の訂正内容のうちの一つを選択
することができることによって減少される。
【0012】付加的な目的、利点および本発明の新規な
特徴は、以下の詳細な説明の部分で明らかとなり、また
その部分において検査により明白となるか、あるいは本
発明の実施により分かるであろう。本発明の目的および
利点は、特許請求の範囲で指摘されている方法および装
置によって理解され、また得られるであろう。
【0013】
【発明の実施の形態】以下に、本発明に係るビットマッ
プ選択を用いて光学式文字認識の訂正を行うための方法
および装置、並びに、OCR出力の誤りを訂正するため
に一連の命令を記録したコンピュータ読み取り可能な記
録媒体を添付図面の図に示された具体例によって説明す
るが、本発明はそれに制限されるものではない。また図
面においては、同じ参照符号を付された構成要素は同様
の構成要素であることを表している。
【0014】OCR出力の誤りを訂正する方法および装
置について説明する。以下の説明においては、説明の便
宜上、本発明を完全に理解するために多数の特別な細部
が設けられている。しかしながら本発明はこれらの特別
な細部がなくても実施可能であるということは、明らか
である。別の例では、本発明をいたずらに分かり難くす
るのを避けるために、周知の構造および装置はブロック
図の形態で示されている。
【0015】(ハードウェアの概略)図1について説明
すると、本発明の一例が実施され得るコンピュータシス
テム100のブロック図が示されている。コンピュータ
システム100は、情報を伝達するためにバス110ま
たは他の伝達手段を備えており、また情報を処理するた
めにプロセッサ112がバス110に接続されている。
さらにコンピュータシステム100はランダムアクセス
メモリ(RAM)または他のダイナミック記憶装置11
4(メインメモリとして示されている)を備えており、
そのメインメモリ114は、情報およびプロセッサ11
2によって実行されるべき命令を記憶するためにバス1
10に接続されている。またメインメモリ114は、プ
ロセッサ112が命令を実行している間、一時的な変数
や他の中間的な情報を記憶するのにも使用されてもよ
い。またコンピュータシステム100は読出し専用メモ
リ(ROM)および他のスタティック記憶装置116の
一方または両方を備えており、それらはバス110に接
続されていて、静的な情報およびプロセッサ112に対
する命令を記憶する。データ記憶装置118は、例えば
磁気ディスクや光ディスクおよびそれに相当するディス
クのドライブであり、情報および命令を記憶するために
バス110に接続され得る。
【0016】またコンピュータシステム100には、バ
ス110を介して入出力装置が接続され得る。例えばコ
ンピュータシステム100は、コンピュータのユーザに
情報を表示するために、例えばブラウン管(CRT)の
ような表示装置120を用いる。さらにコンピュータシ
ステム100は、キーボード122および例えばマウス
のようなカーソル制御手段124を用いる。加えてコン
ピュータシステム100は、紙の文書をコンピュータの
読込み可能なフォーマットに変換するためのスキャナー
126を用いてもよい。さらにまたコンピュータシステ
ム100は、スキャナー126によって生成された文書
イメージ、またはメインメモリ114や記憶装置118
に記憶された文書イメージにおける文字を認識するため
にOCR装置128を用いることができる。あるいはO
CR装置128の機能は、メインメモリ114に記憶さ
れた命令をプロセッサ112で実行することによって、
ソフトウェアで実施され得る。さらに別に例では、スキ
ャナー126とOCR装置128は、紙の文書を走査し
てそこにある文字を認識するように設計された単一の装
置に組み合わせられ得る。
【0017】本発明は、OCR出力において誤りを訂正
するためにコンピュータシステム100を使用すること
に関する。一実施の形態によれば、OCR出力の誤りを
訂正することは、メインメモリ114に格納された一連
の命令をプロセッサ112が実行することに応じてコン
ピュータシステム100によって遂行される。そのよう
な命令は、例えばデータ記憶装置118のような別のコ
ンピュータ読込み可能媒体からメインメモリ114内に
読み込まれてもよい。メインメモリ114内に格納され
た一連の命令を実行することによって、プロセッサ11
2は後述する処理工程を遂行することとなる。別の例で
は、本発明を実施するためにソフトウェアによる命令に
代えて、あるいはソフトウェアの命令とともにハードワ
イヤード回路が用いられてもよい。従って、本発明はハ
ードウェア回路とソフトウェアとの如何なる特定の組合
わせにも制限されない。
【0018】(合成文書アーキテクチャ)合成文書は、
ある文書の多数の表現を有しており、その多数の表現を
論理的な全体として取り扱う。図2に示される合成文書
200は、例えばコンピュータシステム100のメイン
メモリ114や記憶装置118のようなメモリに記憶さ
れている。
【0019】合成文書200は文書イメージ210を備
えており、そのイメージは文書の文書(例えばスキャナ
ー126から生成されたTIFFファイル)のビットマ
ップ表示である。例えばアメリカ合衆国憲法のコピー
は、文書イメージ210の形態でアメリカ合衆国憲法の
イメージを生成するために、スキャナー126によって
読取り走査されてもよい。
【0020】ビットマップ表示はピクセルの列であり、
モノクロ(例えば黒と白)または多色(例えば赤、青、
緑等)で表され得る。従って文書イメージ210の矩形
領域の位置は、例えば矩形の左上隅と右下隅を組み合わ
せることによって特定され得る。アメリカ合衆国憲法を
読取り走査する例では、前文の「form」という単語の最
初の文字は、左上が(16,110)の座標で右下が
(31,119)の座標の矩形内に配置されてもよい。
従って同じ単語の最後の文字は、左上が(16,14
0)の座標で右下が(31,149)の座標の矩形内に
配置され得る。
【0021】また合成文書200は、文書テキスト22
0および相関テーブル230を備えており、それらは図
3のフローチャートに示す方法によって生成されてもよ
い。文書テキスト220は、符号化したASCII、E
BCDICまたは単一コード(Unicode )に文字を符号
化した一続きの8ビットまたは16ビットのバイトでで
きている。従って文書テキスト220内の文字は、文書
テキスト220内にオフセットにより配置され得る。前
記例では、相関テーブル230のオフセット欄に表され
るように、前文の「form」という単語の最初の文字はオ
フセット57に、また同じ単語の最後の文字はオフセッ
ト60に配置され得る。
【0022】図3について説明すると、ステップS25
0で、文書イメージ210内の文字は、OCR装置12
8またはそれと同等のものによって認識され、ステップ
S252で、文書テキスト220に保存される。またO
CR装置128は、ステップS250において、認識さ
れる文字の文書イメージにおける座標を出力するように
設計されている。従って文書テキスト220内の分かっ
ているオフセットにて認識された文字は、文書イメージ
210の領域に関連付けられ得る。上記例では、オフセ
ット57にある文字は、座標(16,110)および
(31,119)によって定義される領域に関係づけら
れている。
【0023】加えてOCR装置128の幾つかの実施例
は、当該技術分野において周知のように、その認識結果
が正しい結果である可能性を示す認識確度パラメータを
出力するように設計されている。例えばあるフォント
で、文書イメージ210の文字「rn」は、判断され得る
可能性を有する文字「m 」として認識されるかもしれな
い。この場合には、OCR装置128は例えばその文字
対に対して60%の認識確度パラメータを出力してもよ
い。
【0024】ステップS254で、文書テキスト220
の単語は、例えば空白の間の文字を語として解釈するこ
とによって特定される。ステップS254で、その語の
文字に対応する文書イメージ210の領域は、合体され
て文書テキスト220の完全な語に対応する1つの領域
になる。一実施の形態では、文書領域は、個々の文字に
対応する領域の座標のうち最も左上の座標と最も右下の
座標を有する矩形として特定される。例えば先の前文に
おける「form」という単語に対応する領域は、座標(1
6,110)および(31,149)を有する矩形によ
って特定される。あるいは特に種々のサイズの文字を有
する文書に対しては、全ての基本的な文字に対する座標
リストは保存されてもよい。
【0025】ある単語が特定されると、全ての文字また
は文字対の認識確度パラメータからその単語に対する認
識確度パラメータが計算される。好ましくは単語に対す
る認識確度パラメータは、個々の文字に基づく認識確度
パラメータを掛け合わせることによって算出される。
「form」という単語を認識する場合には、「f 」および
「o 」の文字はきわめて高い認識確度パラメータ(例え
ば95%および90%)を有するが、しかし「rm」の文
字対は60%の認識確度パラメータしか有していないか
もしれない。これらの認識確度パラメータを掛け合わせ
ると、全体の認識確度パラメータは51.3%となる。
あるいは別の計算では、例えばその単語に対して最小の
認識確度パラメータ(例えば60%)が用いられてもよ
い。
【0026】ステップS256で、文書テキスト220
の各語についての情報は相関テーブル230に保存さ
れ、そのため文書イメージ210の領域は文書テキスト
220の語に関係づけられ得る。特に相関テーブル23
0は、文書イメージ210における領域を特定する座標
対232、文書テキスト220における単語の位置を特
定するオフセット対234、およびその単語に対する認
識確度パラメータ236を格納する。上記例では、「fo
rm」という単語は、(16,110)および(31,1
49)の座標対232と、57および60のオフセット
対234と、51.3%の認識確度パラメータ236を
有する。
【0027】相関テーブル230を用いると、文書テキ
スト220におけるオフセット234は、座標232で
特定される文書イメージ210の領域に対応し、その逆
も同じである。例えば(23,127)の座標が与えら
れると、与えられた座標が、オフセット57−60に位
置する単語内に含まれていることを決めるために、相関
テーブル230の座標232の縦列が調べられ得る。文
書テキスト220のそのオフセットに位置する単語、上
記例の場合には、「form」という単語が導き出され得
る。
【0028】もう一方については、与えられたオフセッ
ト(例えば58)に対して相関テーブル230が調べら
れ、そしてその結果として(16,110)および(3
1,149)の座標を有する矩形が特定される。従っ
て、ここで説明された合成文書アーキテクチャは、文書
テキスト220における語の配置を文書イメージ210
の対応する領域に関係づける一方法を提供している。
【0029】(OCR出力の誤りの訂正)元の紙の文書
を参照するのに関する時間を減らすために、元の紙の文
書の読取り走査されたイメージ(即ち文書イメージ21
0)は、校正する人に対して表示される。アメリカ合衆
国憲法を読取り走査した例において、前文の読取り走査
されたイメージが、図4に示すようにイメージ表示30
0内に表示されていてもよい。
【0030】本発明の一実施の形態によるOCR出力の
誤りの訂正処理が図5のフローチャートに示されてい
る。ステップS310では、文書イメージ210は、例
えば高解像度モニタのような表示装置120上にイメー
ジ表示300として表示される。加えてカーソル302
はイメージ表示300上に表示される。そしてユーザ
は、マウスやトラックボールやジョイスティックのよう
なカーソル制御手段124を用いて、イメージ表示30
0の如何なる部分上にもカーソル302を位置させても
よい。
【0031】ステップS312で、誤り訂正装置は、イ
メージ表示300上のある位置または位置の領域を選択
する入力を受け取る。この入力は、カーソル302がイ
メージ表示300上に置かれる時にはいつでも、あるい
はユーザがボタンを操作する時にのみ、カーソル制御手
段124によって自動的に生成されてもよい。後者の場
合には、ユーザがボタンを操作する時に、カーソル制御
手段124はカーソル302の現在の位置を入力として
送る。例えばユーザがカーソル制御手段124としてマ
ウスを使用している場合には、マウスのボタンをクリッ
クすると誤り訂正装置に単独の位置が送られ、一方クリ
ックしながらドラッグする操作によってはテキストのあ
る範囲を選択するために誤り訂正装置に2つの位置が送
られる。
【0032】ステップS312で受け取られる入力に関
連付けられる位置は、当該技術分野において周知のマッ
ピング技術によって、イメージ表示300の座標システ
ムから文書イメージ210の座標システムに変換され
る。量の多い文書の文書イメージ210は、それよりも
小さいイメージ表示300内に納まらないので、座標変
換はしばしば必要となる。
【0033】図4に示す例では、イメージ表示300に
おけるカーソル302の位置は文書イメージ210の座
標(23,127)に対応している。
【0034】ステップS314では、ステップS312
で受け取られた入力から得られた座標または座標の領域
を含む領域232を指定する記載を求めて、相関テーブ
ル230が調べられる。上記例では、座標(23,12
7)は、(16,110)−(31,149)の座標範
囲によって決まる領域に含まれる。文書テキスト220
に対するオフセット対234は、相関テーブル230の
記載から取り出され、そして文書テキスト220におい
て選択されたテキスト、この場合には語を決めるために
使用される。上記例では、対応するオフセット対は57
−60である。このオフセット対は、オフセット対23
4の範囲内のオフセットにて文書テキスト220内に置
かれた文字列を抜き出すのに使用される。上記例では前
文の「form」という元の単語が「fonn」として誤認識さ
れたと仮定したが、その場合そのオフセット対234の
範囲で選択された語は「fonn」となるであろう。
【0035】ステップS316では、認識されたテキス
トを生成し得たと思われる可能性のある置換え語または
テキスト(一語よりも多い場合)が生成される。当該技
術分野において、可能性のある置換えテキストを生成す
るために広範囲な種々の技術が知られているが、しかし
発明を実施するにはどれか特定の技術であることを必要
としない。例えば可能性のある置換えテキストを生成す
るために、文字レベルを対象とすること(すなわちある
文字または文字対が別の文字として誤認識される可能性
がある)が用いられ得る。別の例として、可能性のある
置換え語を生成するために、単語レベルの挙動が、例え
ばスペルチェックを行うことによって考慮され得る。さ
らに別の例として、句レベルの情報(例えばデータベー
ス内に存在する連続語のマルコフモデル)が用いられ得
る。さらにはこれらの種々の技術は組み合わされて重み
を付けられ得る。上記例では、ステップS316は、選
択されたテキスト「fonn」に対して以下の可能性のある
置換え語の組、すなわち「faun」、「form」、「fai
n」、「fawn」および「fern」を生成してもよい。
【0036】ステップS318で、選択されたテキスト
および可能性のある置換えテキストは、カーソル302
の近くでポップアップメニュー304内に表示される。
実際に認識された文字、すなわち選択されたテキストは
標準的な位置、例えば一番目にポップアップメニュー3
04内に表示され、そのためユーザは認識された文字が
何であるかを容易に判断することができる。従って上記
例では、ポップアップメニュー304は、一番目に「fo
nn」という選択された語を表示し、続いて可能性のある
置換えテキストである「faun」、「form」、「fain」、
「fawn」および「fern」を好ましくは置換えの可能性の
高い順序で表示する。可能性のある置換えテキストを置
換えの可能性の高い順序で並べる基準は、認識確度パラ
メータを用いてもよいし、認識確度パラメータを用いず
に他の手法を用いてもよいし、または重要な多くの要因
の一つとして認識確度パラメータを含んでいてもよ
い。。
【0037】ポップアップメニューが表示されると、ユ
ーザは、文書イメージ210のイメージ表示300を見
ることによって、ポップアップメニュー304内に表示
された選択されたテキストが正しくないことを判断する
ことができる。この場合には、ユーザ正しい置換えテキ
ストを探して可能性のある置換えテキストを見るであろ
う。正しい置換えテキストが見つかったら、ユーザはそ
の正しい置換えテキストを選択することができる(例え
ばカーソル制御手段124のボタンをクリックするか放
すことによって)。上記例では、正しい置換えテキスト
は「form」であり、ポップアップメニュー304の「fa
un」と「fain」の間に表示されている。
【0038】他方では、正しい置換えテキストがポップ
アップメニュー304内にない場合には、ユーザは従来
の手段によって(例えばキーボード122を介して)正
しい置換えテキストを入力してもよい。ステップS32
0で正しい置換えテキストのための入力が受け取られた
後、ステップS322において選択されたテキストは正
しいテキストで置き換えられる。さらに特に文書テキス
ト220は正しい置換えテキストを含むように更新さ
れ、相関テーブル230内の認識確度パラメータ236
は極めて高い値(例えば100%)を反映するように更
新される。置換えテキストの文字数は、選択されたテキ
ストの文字数よりも多いかまたは少なくてもよいので、
相関テーブル230内のオフセット234のフィールド
は、全ての影響される記載事項のため(すなわち置換え
後の文書内のテキスト用)に更新される。可能性のある
置換えテキストを生成し、それらをポップアップメニュ
ー304内に表示することによって、OCR出力に対し
て訂正を行うのに費やされる時間が減る。
【0039】(誤りの発見)一実施の形態によれば、カ
ーソル302がイメージ表示300のある語の上にある
場合には、そのカーソルの位置が自動的に入力され、そ
のためポップアップメニュー304が自動的に表示され
る。従ってユーザは、イメージ表示300のテキストの
表示列の上にカーソル302を動かすことができ、ポッ
プアップメニュー304内の基準位置に自動的に表示さ
れる選択されたテキストを比較することができる。従っ
てユーザは、ある文字がOCR装置128によって誤認
識されたか否かを判断するために元の紙を見るのに要す
る時間を費やさずに済む。もしその語が違っている場合
には、ユーザは上述したようにしてそのテキストを訂正
することができる。
【0040】別の実施の形態によれば、最も誤認識の可
能性の高い語は、他と異なるように表示される(例えば
強調したり、色やフォントを変えたり、明滅させたり、
下線を付すなど)。これらの語は、対応する認識確度パ
ラメータ236を規定された閾値と比較することにより
判断され得る。例えば認識確度パラメータ236が60
%より低い語は赤で表示され、間違っていそうな語にユ
ーザの注意を向けさせる。上記例においては、元の「fo
rm」という語が、認識確度パラメータ236が55%
で、「fonn」として誤認識されている。この場合には、
文書テキスト220の「fonn」という語に対応するイメ
ージ表示300の領域の黒色のピクセルは赤色で表示さ
れる。好ましい実施の形態では、文字イメージを構成す
るピクセルの色を変える代わりに、文字のイメージの周
囲の背景ピクセルの色が変えられる。
【0041】従ってユーザは、文書イメージ210内の
「form」という語の上にカーソル302を位置させ、ポ
ップアップメニュー304が表示されるとその語が「fo
nn」として誤認識されたことを知り、適切な訂正を行
う。訂正された語の認識確度パラメータ236は100
%に再設定され、文書イメージ210の、訂正された語
に対応する領域の表示が黒に戻される。
【0042】さらに別の実施の形態では、一般に同一出
願人による「ヒートマップを用いて光学式文字認識の訂
正を行うための方法および装置、並びに、OCR出力の
誤りを発見するための一連の命令を記録したコンピュー
タ読み取り可能な記録媒体」で特定される関連特許出願
の中に記載されているように、文書イメージ210の領
域にふさわしいそれぞれの表示色を決めるために、認識
確度パラメータ236は複数の閾値と比較される。その
結果生じる「ヒートマップ」は、光学式文字認識につい
て、ユーザを文書イメージの最も問題のある部分に導く
助けとなる。
【0043】本発明は、特定の実施の形態について言及
しながら特に詳細に説明され、また図示されたが、本発
明の趣旨または範囲から逸脱することなく、形態または
細部について上記説明または図における変形がなされて
もよいということは、当業者により理解されるであろ
う。
【0044】
【発明の効果】以上説明したとおり、この発明によるビ
ットマップ選択を用いて光学式文字認識の訂正を行うた
めの方法および装置、並びに、OCR出力の誤りを訂正
するために一連の命令を記録したコンピュータ読み取り
可能な記録媒体によれば、元のテキストをOCR出力の
テキストに変換している間に起こった間違いを正す際
に、ユーザが元の紙の文書を見なくても済むとともに、
可能な訂正内容が自動的に生成され、それによってユー
ザが訂正を容易に行うことができるという効果を奏す
る。
【図面の簡単な説明】
【図1】本発明が実施され得るコンピュータシステムの
上位ブロック図である。
【図2】合成文書アーキテクチャのブロック図である。
【図3】合成文書の生成処理を示すフローチャートであ
る。
【図4】本発明の一実施の形態によるスクリーン表示の
一例を示す図である。
【図5】一実施の形態によるOCR出力における誤りの
訂正処理を示すフローチャートである。
【符号の説明】
112 プロセッサ 118 データ記憶装置(コンピュータ読込み可能媒
体) 120 表示装置 124 カーソル制御手段 128 光学式文字認識装置 210 文書イメージ 220 文書テキスト 236 認識確度パラメータ 304 ポップアップメニュー

Claims (15)

    【特許請求の範囲】
  1. 【請求項1】 OCR出力の誤りを発見する方法におい
    て、 文書テキストを生成するために文書イメージ内の文字を
    認識する工程と、 文書テキストの語に対応する文書イメージの領域を決定
    する工程と、 文書イメージを表示する工程と、 文書イメージ内のある位置を選択する入力を受け取る工
    程と、 文書イメージ内のその位置を含む文書領域に対応してな
    る、選択されたテキストを決定する工程と、 その選択されたテキストを表示する工程と、 置換えテキストを指示する入力を受け取る工程と、 文書テキスト内の選択されたテキストをその置換えテキ
    ストで置き換える工程と、 を含むことを特徴とするビットマップ選択を用いて光学
    式文字認識の訂正を行うための方法。
  2. 【請求項2】 選択されたテキストに基づいて1または
    2以上の可能性のある置換えテキストを決定する工程
    と、 1または2以上の可能性のある置換えテキストを表示す
    る工程と、 をさらに含み、 置換えテキストを指示する入力を受け取る工程は、それ
    ら1または2以上の可能性のある置換えテキストの内の
    一つを選択する入力を受け取る工程を含むことを特徴と
    する請求項1に記載のビットマップ選択を用いて光学式
    文字認識の訂正を行うための方法。
  3. 【請求項3】 置換えテキストを指示する入力を受け取
    る工程は、置換えテキストのキーボード入力を受け取る
    工程を含むことを特徴とする請求項2に記載のビットマ
    ップ選択を用いて光学式文字認識の訂正を行うための方
    法。
  4. 【請求項4】 選択されたテキストを表示する工程は、
    ポップアップメニュー内の基準位置に選択されたテキス
    トを表示する工程を含み、 また1または2以上の可能性のある置換えテキストを表
    示する工程は、ポップアップメニュー内に1または2以
    上の可能性のある置換えテキストを表示する工程を含む
    ことを特徴とする請求項2に記載のビットマップ選択を
    用いて光学式文字認識の訂正を行うための方法。
  5. 【請求項5】 文書イメージの領域に対して認識確度パ
    ラメータを決定する工程をさらに含み、 文書イメージを表示する工程は、文書イメージの領域を
    それぞれの領域に対する認識確度パラメータを表すよう
    に表示する工程を含むことを特徴とする請求項1に記載
    のビットマップ選択を用いて光学式文字認識の訂正を行
    うための方法。
  6. 【請求項6】 OCR出力の誤りを訂正する装置であっ
    て、 文書テキストを生成するために文書イメージ内の文字を
    認識するOCR装置と、 文書テキストの語に対応する文書イメージの領域を決定
    する手段と、 文書イメージを表示する表示装置と、 文書イメージ内のある位置を選択する入力を受け取るカ
    ーソル制御手段と、 文書イメージ内のその位置を含む文書領域に対応してな
    る、選択されたテキストを決定し、その選択されたテキ
    ストを表示するために前記表示装置を制御する手段と、 文書テキスト内の選択されたテキストをその置換えテキ
    ストで置き換える手段と、 を具備することを特徴とするビットマップ選択を用いて
    光学式文字認識の訂正を行うための装置。
  7. 【請求項7】 選択されたテキストに基づいて1または
    2以上の可能性のある置換えテキストを決定する手段を
    さらに具備し、 前記表示装置は、1または2以上の可能性のある置換え
    テキストを表示するために制御され、 前記カーソル制御手段は、1または2以上の可能性のあ
    る置換えテキストの内の一つを選択する入力を受け取る
    ことを特徴とする請求項6に記載のビットマップ選択を
    用いて光学式文字認識の訂正を行うための装置。
  8. 【請求項8】 置換えテキストの入力を受け取るキーボ
    ードを具備することを特徴とする請求項7に記載のビッ
    トマップ選択を用いて光学式文字認識の訂正を行うため
    の装置。
  9. 【請求項9】 前記表示装置は、ポップアップメニュー
    内の基準位置に、選択されたテキストを表示し、かつポ
    ップアップメニュー内に1または2以上の可能性のある
    置換えテキストを表示するために制御されることを特徴
    とする請求項7に記載のビットマップ選択を用いて光学
    式文字認識の訂正を行うための装置。
  10. 【請求項10】 文書イメージの領域に対して認識確度
    パラメータを決定する手段をさらに具備し、 前記表示装置は、文書イメージの領域をそれぞれの領域
    に対する認識確度パラメータを表すように表示するよう
    に制御可能になっていることを特徴とする請求項6に記
    載のビットマップ選択を用いて光学式文字認識の訂正を
    行うための装置。
  11. 【請求項11】 OCR出力の誤りを訂正するために一
    連の命令を記録したコンピュータ読み取り可能な記録媒
    体であって、 該一連の命令は、 文書テキストを生成するために文書イメージ内の文字を
    認識する工程と、 文書テキストの語に対応する文書イメージの領域を決定
    する工程と、 文書イメージを表示する工程と、 文書イメージ内のある位置を選択する入力を受け取る工
    程と、 文書イメージ内のその位置を含む文書領域に対応してな
    る、選択されたテキストを決定する工程と、 その選択されたテキストを表示する工程と、 置換えテキストを指示する入力を受け取る工程と、 文書テキスト内の選択されたテキストをその置換えテキ
    ストで置き換える工程と、 を実行するための一連の命令を記録したことを特徴とす
    るコンピュータ読み取り可能な記録媒体。
  12. 【請求項12】 前記一連の命令は、 選択されたテキストに基づいて1または2以上の可能性
    のある置換えテキストを決定する工程と、 1または2以上の可能性のある置換えテキストを表示す
    る工程と、 を実行するための一連の命令をさらに含み、 置換えテキストを指示する入力を受け取る工程は、それ
    ら1または2以上の可能性のある置換えテキストの内の
    一つを選択する入力を受け取る工程を含むことを特徴と
    する請求項11に記載のコンピュータ読み取り可能な記
    録媒体。
  13. 【請求項13】 置換えテキストを指示する入力を受け
    取る工程は、置換えテキストのキーボード入力を受け取
    る工程を含むことを特徴とする請求項12に記載のコン
    ピュータ読み取り可能な記録媒体。
  14. 【請求項14】 選択されたテキストを表示する工程
    は、ポップアップメニュー内の一番目に選択されたテキ
    ストを表示する工程を含み、 また1または2以上の可能性のある置換えテキストを表
    示する工程は、ポップアップメニュー内に1または2以
    上の可能性のある置換えテキストを表示する工程を含む
    ことを特徴とする請求項12に記載のコンピュータ読み
    取り可能な記録媒体。
  15. 【請求項15】 前記一連の命令は、文書イメージの領
    域に対して認識確度パラメータを決定する工程を実行す
    るための一連の命令をさらに含み、 文書イメージを表示する工程は、文書イメージの領域を
    それぞれの領域に対する認識確度パラメータを表すよう
    に表示する工程を含むことを特徴とする請求項11に記
    載のコンピュータ読み取り可能な記録媒体。
JP10110881A 1997-07-25 1998-04-21 ビットマップ選択を用いて光学式文字認識の訂正を行うための方法および装置、並びに、ocr出力の誤りを訂正するために一連の命令を記録したコンピュータ読み取り可能な記録媒体 Pending JPH11102412A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US90078697A 1997-07-25 1997-07-25
US08/900786 1997-07-25

Publications (1)

Publication Number Publication Date
JPH11102412A true JPH11102412A (ja) 1999-04-13

Family

ID=25413075

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10110881A Pending JPH11102412A (ja) 1997-07-25 1998-04-21 ビットマップ選択を用いて光学式文字認識の訂正を行うための方法および装置、並びに、ocr出力の誤りを訂正するために一連の命令を記録したコンピュータ読み取り可能な記録媒体

Country Status (2)

Country Link
JP (1) JPH11102412A (ja)
KR (1) KR19990014164A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110647878A (zh) * 2019-08-05 2020-01-03 紫光西部数据(南京)有限公司 基于截屏图片的数据处理方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110276738B (zh) * 2019-06-28 2023-07-28 上海工程技术大学 一种bmp图像的roi替换处理方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2705343B2 (ja) * 1991-04-09 1998-01-28 三菱電機株式会社 電動送風機
US5814910A (en) * 1995-09-06 1998-09-29 Eldim, Inc. Cooling vanes for rotating electric machinery

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110647878A (zh) * 2019-08-05 2020-01-03 紫光西部数据(南京)有限公司 基于截屏图片的数据处理方法

Also Published As

Publication number Publication date
KR19990014164A (ko) 1999-02-25

Similar Documents

Publication Publication Date Title
JPH11102414A (ja) ヒートマップを用いて光学式文字認識の訂正を行うための方法および装置、並びに、ocr出力の誤りを発見するための一連の命令を記録したコンピュータ読み取り可能な記録媒体
US6532461B2 (en) Apparatus and methodology for submitting search oueries
US20030200505A1 (en) Method and apparatus for overlaying a source text on an output text
US6466694B2 (en) Document image processing device and method thereof
US8044961B2 (en) Automatic synthesis of font tables for character layout
US20200104586A1 (en) Method and system for manual editing of character recognition results
JP2655729B2 (ja) 画像処理装置及び方法
JPH11102412A (ja) ビットマップ選択を用いて光学式文字認識の訂正を行うための方法および装置、並びに、ocr出力の誤りを訂正するために一連の命令を記録したコンピュータ読み取り可能な記録媒体
KR20010015963A (ko) 한자의 일자대조에 의한 교정 시스템
JPH11102413A (ja) 光学式文字認識出力のポップアップ訂正のための方法および装置
JPH11102415A (ja) 光学式文字認識出力の二元スクリーン表示のための方法および装置
JP2003132078A (ja) データベース構築装置、データベース構築方法、データベース構築プログラム、記録媒体
JP3221968B2 (ja) 文字認識装置
JP2007058819A (ja) 索引情報生成装置
JPH06223221A (ja) 文字認識装置
JPH10334179A (ja) 楽譜認識装置
JP3302211B2 (ja) 文字処理システム及びその外字パターン登録方法
JP2901525B2 (ja) 文字作成方式
JP4081074B2 (ja) 帳票処理装置、帳票処理方法、及び帳票処理プログラム
JPH01292586A (ja) 文字認識支援装置
JPH11143993A (ja) 認識文字修正装置およびその方法
JPH01292587A (ja) 画像処理方法
JP2829186B2 (ja) 光学的文字読取装置
JPH06149888A (ja) 電子ファイリングシステム
JP4774876B2 (ja) データ入力装置及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050420

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071030

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080513