JP2000029985A - Ocr操作方式 - Google Patents

Ocr操作方式

Info

Publication number
JP2000029985A
JP2000029985A JP10208643A JP20864398A JP2000029985A JP 2000029985 A JP2000029985 A JP 2000029985A JP 10208643 A JP10208643 A JP 10208643A JP 20864398 A JP20864398 A JP 20864398A JP 2000029985 A JP2000029985 A JP 2000029985A
Authority
JP
Japan
Prior art keywords
data
correction
character
ocr
check
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10208643A
Other languages
English (en)
Inventor
Masato Kano
正人 加納
Shigeo Kashiwagi
繁雄 柏木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Engineering Ltd
Original Assignee
NEC Engineering Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Engineering Ltd filed Critical NEC Engineering Ltd
Priority to JP10208643A priority Critical patent/JP2000029985A/ja
Publication of JP2000029985A publication Critical patent/JP2000029985A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】OCR装置において読取り不能文字が発生した
場合に修正処理を迅速に行い操作性を改善する。 【解決手段】帳票に記載された文字が数値データであ
り、この数値データの整合性を評価する何らかの関係式
が帳票内のデータを使用して成立可能な場合に、この数
値データである文字が読取れず且つその認識結果の候補
が1文字以上存在するとき、この候補データの整合性を
評価する関係式に代入して、読取り不能データの修正を
候補文字毎にチェックし、読取不能データの修正処理を
軽減して操作性の向上を図る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明はOCR(光学的文字
読取装置)、特にOCRにて帳票等に記載された文字が
読取れない場合に修正するOCR操作方式に関する。
【0002】
【従来の技術】OCR装置は、帳票等に記載された文字
や数字(以下単に文字という)を光ビームの走査等によ
り高速で読取り、コンピュータ等に入力することができ
るので、種々の分野で広く使用されている。
【0003】OCR装置においては、誤認識も生じ得
る。この誤認識を低減することが、識別速度又は効率の
改善に極めて重要である。そこで、誤認識と判断された
候補文字については、更に後処理を行うことにより、認
識精度を高めている。
【0004】特に文字認識の後処理として、言語の文法
知識を利用したものが多い。その代表的なものに、形態
素解析がある。これは、認識された文字列について、所
定数の文字単位に辞書を検索して言語を区切り、その品
詞間の接合チェックを行って評価値を計算し、最優先単
語を選択して文字を確定する手法である。
【0005】
【発明が解決しようとする課題】上述した従来のOCR
僧徒方式によると、文法知識や辞書検索によって類推可
能なのは単語となる文字であり、数値データについては
関係式によって誤り検出が可能であるのみである。数値
データの場合、認識処理結果からのデータと、数値デー
タを評価する後処理とが別々に動作するので、自動的な
修正処理は行われないのが殆どであった。
【0006】また、数値データそのものにデータの整合
性を確認するデータが含まれる場合は、後処理のみでも
自動的な修正が可能である。このときは、データ内に確
認の為の負荷データが必要であり、予め定められたデー
タには有効であるが、それ以外の場合には適用できな
い。
【0007】つまり、読取れなかった文字が数値データ
の場合には、必ず読取り結果を修正してからデータの整
合性を評価している。また、この場合でもオペレータが
確定できないときは、複数回の修正が必要となった。
【0008】そこで、本発明の目的は、帳票に記載され
た文字が数値データであり、この数値データの整合性を
評価する何らかの関係式が帳票内のデータを使用して成
立可能な場合に、この数値データである文字が読取れず
且つその認識結果の候補が1文字以上存在するとき、こ
の候補データの整合性を評価する関係式に代入して、読
取り不能データの修正を候補文字毎にチェックし、読取
不能データの修正処理を軽減して操作性の向上を図るO
CR操作方式を提供することにある。
【0009】
【課題を解決するための手段】前述の課題を解決するた
め、本発明によるOCR操作方式は次のような特徴的な
構成を採用している。
【0010】(1)帳票等に書き込まれた文字データを
OCR装置で読取り、読取り不能が生じた場合に前記読
取り不能文字を修正するOCR操作方式において、前記
読取り不能文字に対応する第1位候補及び第2位候補の
如く複数の修正データを入力してデータ修正を行うOC
R操作方式。
【0011】(2)前記複数の修正データは修正画面上
に表示され、オペレータが選択可能である上記(1)の
OCR操作方式。
【0012】(3)帳票等に書込まれた文字データをO
CR装置で読取り、読取り不能文字を修正するOCR操
作方式において、読取られた帳票データを格納する帳票
データ管理部と、前記帳票データの読取り不能文字の修
正時に複数の修正データを入力するデータ表示/操作部
と、前記複数の入力データを格納する修正入力データ部
と、該修正入力データ部を使用して前記帳票データのデ
ータ整合性をチェックするデータチェック手段とを備え
るOCR操作方式。
【0013】(4)前記帳票のデータレイアウト及びチ
ェックの設定情報を管理する帳票書式情報部を更に備え
る上記(3)のOCR操作方式。
【0014】(5)前記データ整合性チェックには、前
記第1位候補の修正データでエラー発生の有無を調べた
後、前記第2位候補の修正データでエラー発生の有無を
調べる上記(1)又は(2)のOCR操作方式。
【0015】
【発明の実施の形態】以下、本発明のOCR操作方式の
好適実施形態例の構成及び動作を添付図を参照して詳細
に説明する。
【0016】先ず、図1は本発明のOCR操作方式の好
適実施形態例の制御ブロック図である。このOCR操作
方式の実現には、修正制御部10、帳票データ管理部1
1、データ表示/操作部12、修正入力データ部13、
データチェック手段14及び帳票書式情報部15を有す
る。
【0017】帳票データ管理部11は、公知の手段で認
識した帳票の読取り結果が帳票書式情報部15で設定さ
れたデータレイアウトで格納される。データ表示/操作
部12は、帳票データ管理部11内に格納された帳票デ
ータを帳票書式情報部15で指定される画面レイアウト
に従って表示し、修正制御部10の要求により修正デー
タの入力を行う。
【0018】修正入力データ格納部13は、データ表示
/操作部12での修正処理において、1つの読取り不能
文字に複数の修正データが入力されたとき、この入力デ
ータを管理する。データチェック手段14は、データ表
示/操作部12で修正されたデータと、修正入力データ
部13を使って、帳票書式情報部15に設定されるデー
タチェック処理を実行する。また、修正制御部10は、
修正制御全体を司る。
【0019】次に、図1のOCR装置の動作を図2〜図
5のフローチャートに基づき説明する。尚、図2〜図5
のフローチャートは、上記OCR装置の動作処理手順を
分割して示している。また、図6には帳票の例を示し、
(A)は読取り帳票の例を示し、(B)は読取り不能文
字の修正画面の例を示す。
【0020】先ず、図6(A)に示す帳票を公知の認識
手段により読取り、その認識結果が帳票データ管理部1
1へ格納される。このときの帳票データのデータ整合チ
ェック設定は、図6(A)に示す「会員コード」部分に
チェックデジットが設定されている(7桁目がチェツク
デジットコードである。)この例では「012345
7」が正解データである。
【0021】修正制御部10は、帳票データに読取不能
文字が含まれると、帳票書式情報部15の画面レイアウ
トデータと、帳票データ管理部11内の帳票データによ
って、図6(B)に示す如き修正画面データを表示する
(ステップS1)。ここで、読取不能文字は「会員コー
ド」の1桁目であり、読取り不能文字パターンを見ても
修正すべきデータが0か6か判断できない状態である。
【0022】このとき、キー入力で、特定の文字コード
(この特定例では*)が入力されると、データ表示/操
作部12は、複数入力処理と判断し、入力ウインドウを
開く(ステップS2)。オペレータが「6」と「0」を
入力し、リターンキーで確定する(ステップS3)。修
正制御部10は、この複数の入力データを修正入力デー
タとして、修正入力データ(格納)部13へ登録する
(ステップS4)。図7に、修正入力データの登録形式
例を示す。
【0023】読取り不能文字の入力処理が終了すると
(ステップS5)、修正制御部10は、データチェック
手段14によって帳票データのチェック処理を行う。
【0024】データチェツク手段14は、帳票書式情報
部15によって帳票データ中のフィールドデータを検索
してチェツク対象フィールドを探す(ステップS6)。
この特定実施形態例では「会員コード」にチェック指示
があるので、該当フィールドのフィールド内の文字デー
タを検索する(ステップS7)。このフィールドデータ
内に特定コード「*」があれば、修正入力データ部13
から、このフィールドの文字位置に該当する修正候補デ
ータを読出す(ステップS8)。
【0025】フィールド内文字の検索が終了すると(ス
テップS9)、設定されたデータチェックを実行する。
この特定例では、第1位の候補が「6」であるので、
「6123457」としてデータチェックを実行する。
初回のチェックの結果によってエラーでなければ、次フ
ィールドデータの抽出に移行する(ステップS10)。
エラーであれば、修正入力データ部13の第2位のデー
タを読出して該当位置に文字を格納する(ステップS1
1及びステップS12)。この特定例では、初回のチェ
ック処理はエラーとなるので、修正候補の第2位を同様
にセットして再度チェックを実行する(ステップS1
3)。
【0026】このチェック結果がエラーでなければ、第
2位のデータ修正データとなる。また、この第2位のデ
ータでもエラーが解消しない場合には、他の文字の影響
によるものでチェツクエラー情報を生成する(ステップ
S14)。
【0027】図8はチェツクエラー情報の例を示す。即
ち、エラー登録数(1帳票内)、エラー種別、開始行番
号、開始フィールド番号、終了後番号、終了フィールド
番号の繰り返しである。
【0028】この特定例では、修正データ「0」によっ
てチェックは正常に終了するので、「0」を修正データ
として選択し、次フィールドの処理に移行する。この特
定例でのチェック処理は、フィールド単独のチェックデ
ジットを対象としたが、複数のフィールドによる演算式
によるチェック処理でも同様のことが可能になる。ま
た、この例にあっては、キー入力による修正処理を行っ
たが、OCR装置では認識処理によって生成できる候補
文字を使用して、修正処理前にチェック処理を実行すれ
ば、読取り不能文字の修正処理を軽減することも可能と
なる。
【0029】
【発明の効果】上述の説明から理解される如く、本発明
のOCR操作方式のよると、OCR装置で読取りができ
ない場合に、修正処理用の文字パターンや実物の帳票を
見てもオペレータがいずれの文字とも判断できないとき
に、修正処理が簡単に行える。その理由は、二者択一ま
で絞り込まれたデータであれば、その両方のデータを夫
々チェック処理することにより、いずれかのデータで正
常となる可能性が極めて高い為である。
【0030】従って、本発明のOCR操作方式は、手書
き文字の帳票等をOCR装置で読み取って、コンピュー
タ化する際にその作業効率を大幅に改善できるという実
用上の顕著な効果が得られる。
【図面の簡単な説明】
【図1】本発明のOCR操作方式の好適実施形態例のブ
ロック図である。
【図2】図1に示すOCR装置の動作説明用フローチャ
ートである。
【図3】図1に示すOCR装置の動作説明用フローチャ
ートである。
【図4】図1に示すOCR装置の動作説明用フローチャ
ートである。
【図5】図1に示すOCR装置の動作説明用フローチャ
ートである。
【図6】本発明で使用する帳票を示し、(A)は読取り
帳票の一例であり、(B)は読取り不能文字が発生した
場合の修正画面の例を示す図である。
【図7】本発明で使用する修正入力データの例である。
【図8】本発明におけるチェックエラー情報の例を示す
図である。
【符号の説明】
10 修正制御部 11 帳票データ管理部 12 データ表示/操作部 13 修正入力データ部 14 データチェック手段 15 帳票書式情報部

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】帳票等に書き込まれた文字データをOCR
    装置で読取り、読取り不能が生じた場合に前記読取り不
    能文字を修正するOCR操作方式において、 前記読取り不能文字に対応する第1位候補及び第2位候
    補の如く複数の修正データを入力してデータ修正を行う
    ことを特徴とするOCR操作方式。
  2. 【請求項2】前記複数の修正データは修正画面上に表示
    され、オペレータが選択可能であることを特徴とする請
    求項1に記載のOCR操作方式。
  3. 【請求項3】帳票等に書込まれた文字データをOCR装
    置で読取り、読取り不能文字を修正するOCR操作方式
    において、 読取られた帳票データを格納する帳票データ管理部と、 前記帳票データの読取り不能文字の修正時に複数の修正
    データを入力するデータ表示/操作部と、 前記複数の入力データを格納する修正入力データ部と、 該修正入力データ部を使用して前記帳票データのデータ
    整合性をチェックするデータチェック手段とを備えるこ
    とを特徴とするOCR操作方式。
  4. 【請求項4】前記帳票のデータレイアウト及びチェック
    の設定情報を管理する帳票書式情報部を更に備えること
    を特徴とする請求項3に記載のOCR操作方式。
  5. 【請求項5】前記データ整合性チェックには、前記第1
    位候補の修正データでエラー発生の有無を調べた後、前
    記第2位候補の修正データでエラー発生の有無を調べる
    請求項1又は2に記載のOCR操作方式。
JP10208643A 1998-07-08 1998-07-08 Ocr操作方式 Pending JP2000029985A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10208643A JP2000029985A (ja) 1998-07-08 1998-07-08 Ocr操作方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10208643A JP2000029985A (ja) 1998-07-08 1998-07-08 Ocr操作方式

Publications (1)

Publication Number Publication Date
JP2000029985A true JP2000029985A (ja) 2000-01-28

Family

ID=16559649

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10208643A Pending JP2000029985A (ja) 1998-07-08 1998-07-08 Ocr操作方式

Country Status (1)

Country Link
JP (1) JP2000029985A (ja)

Similar Documents

Publication Publication Date Title
JPH05258099A (ja) 文字認識処理装置
JP3394694B2 (ja) フォーマット情報登録方法及びocrシステム
JP2000029985A (ja) Ocr操作方式
JP2793340B2 (ja) Cad図面検図支援システム
JP2954968B2 (ja) 光学的文字読取装置及び光学的読取装置におけるサブセット情報の追加方法
JPH1185536A (ja) 原始プログラムのエラー自動修正装置及び方法
JP2721617B2 (ja) 情報処理装置
JP2004046388A (ja) 情報処理システムおよび文字修正方法
JPH0612520A (ja) 文字認識装置の確認修正方式
JP2878772B2 (ja) 光学的文字読取装置
JPH0863487A (ja) 文書検索方法及び文書検索装置
JPH01293463A (ja) 文字処理装置
JPH06333083A (ja) 光学式文字読取装置
JP2578862B2 (ja) 誤打鍵警告修正方式
JP4111941B2 (ja) 字句をデータに変換する装置、方法及びプログラム
JPS61198383A (ja) 文字修正装置
JPH10232905A (ja) 文字認識装置における学習辞書の更新方法及び文字認識装置
JPS6337429A (ja) 高級言語プログラムにおける変数代入解析方法
JPH03296164A (ja) テキストエディタ
JPS6398788A (ja) 認識装置
JPH06259455A (ja) 取引データ入力方式
JPH09106434A (ja) Ocrの誤読修正方法
JPH04283853A (ja) カナ−漢字変換方法
JPH06119483A (ja) 文字読み取り装置
JPH03161886A (ja) Ocrの誤読修正方法