JPS6336392A - 閾値設定方式 - Google Patents

閾値設定方式

Info

Publication number
JPS6336392A
JPS6336392A JP61178811A JP17881186A JPS6336392A JP S6336392 A JPS6336392 A JP S6336392A JP 61178811 A JP61178811 A JP 61178811A JP 17881186 A JP17881186 A JP 17881186A JP S6336392 A JPS6336392 A JP S6336392A
Authority
JP
Japan
Prior art keywords
word
ocr
character
threshold
recognition rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61178811A
Other languages
English (en)
Inventor
Kazuji Kiyono
清野 和司
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP61178811A priority Critical patent/JPS6336392A/ja
Publication of JPS6336392A publication Critical patent/JPS6336392A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は光学的文字読取装置(OCR>の後処理(知識
処理)における閾値設定方式に関する。
(従来の技術) 従来、OCRの後処理(知識処理)は、OCRの1文字
車位の読み取り候補群(素読み結果)と内蔵あるいは外
部記・澹として保持している単語情報(単語辞書)とを
比較することにより、最終読み取り結果を決定するのが
一般的である。この1文字車位の読み取り候補群と単語
情報の比較動作において、従来は固定的な閾値か設定し
てあり、単語辞書内の単語と素読み結果との類似度を何
らかの方法で計算し、この類似度か前記閾値を越える単
語を前記辞B内から出力してこれを最終読み取り結果と
し、前記類似度が前記閾値を越える単語がなければ単語
辞書から単語は出力されず、OCRの素読み結果を@柊
読み取り結果としている。
しかし、一般に各文字に対するOCRの認識率は一定で
なく、また単語の出現確率も一定でない。
従って、例えば上記従来の閾値固定方式ではOCRによ
る認識率の高い文字を主として構成された入力単語A(
例えば認識率90?/、)と逆にR2識率の低い文字ば
かりで構成された入力車、:nB(例えばL’Z識率2
0%)とを同一の閾値によって後処理すると、例えば認
識率の高い単語Aを単語辞書内の単語に代えて最終結果
としてしまう誤まった補正が行なわれてしまう可能牲が
あり、また認識率の低い入力単語Bについては単語辞占
内からの単語が出力されず、誤まったOCRの素読み結
果がそのまま出力されてしまうという欠点かあった。
(発明か解決しようとする問題点) 従来の如く、OCRの認識率の高い文字により主として
構成された入力単語と、逆に認識率の低い文字ばかりで
構成された入力単語とを一律の閾値により単語情報と比
較することは、最終的なOCRの文字認識率を低下させ
てしまう欠点があった。そこで、本発明は上記の欠点に
鑑み、OCRによって読み取った読み取り単語の知識処
理を常に適切とすることにより、最終的な文字認識率の
向上を図ることかできる閾値設定方式を提供することを
目的とする。
[発明の構成] (問題点を解決するための手段) 本発明の閾値設定方式は、OCRの読み取りJmと単語
辞書内の単語との類似度が閾値を越える場合、単SR辞
書からの単語を最終読み取り結果とするOCRの知識処
理装置にあって、OCRによる読み取り単語の構成文字
の前記OCRによる認識率の高低を判定する判定手段と
、前記判定手段の判定結果に対応して前記閾値を変化さ
せる閾値設定手段とから構成される。
(作用) 本発明の閾値設定方式において、OCRによる読み取り
単語が前記判定手段により認識率の高い文字で構成され
ていると判定された場合は、閾値設定手段は、前記閾値
を高めに設定して、単語辞書からの単語出力を抑制して
OCRによる読み取り単語の誤補正を防止することがで
きる。又、OCRによる読み取り単語が前記判定手段に
より認識率の低い文字で構成されていると判定された場
合は、閾値設定手段は前記閾値を低めに設定して、単語
辞書からの単語出力を促進してOCRによる読み取り単
δBの補正を行ない易くすることができる。このため、
OCRの知識処理を効果的に行うことができ、最終的な
読み取り率を向上さぜることかできる。
(実施例) 以下本発明の一実施例を図面を参照して説明する。第1
図は本発明を適用したOCRの知識処理’lの一実施例
を示したブロック図である。1は、被読取帳票の単語を
読み取り、読み取り結果を候補文字と共に出力する光学
的文字認識装置(OCR>、2は0CR1によって読み
取られた単語かこのOCRによる認識率の高い文字によ
り王として構成されたものか、逆に認識率の低い文字ば
かりで構成されたものかを判断し、この判断結末に対応
した閾値を出力する閾値設定装置、3は閾値設定装置2
における前記判断のための情報即ち、文字の発生頻度情
報、文字連接情報及び文字別S2識率情報を保持してい
る閾値設定用知識ベース、4は0CR1の読み取り単語
を単語情報と比較し、両者の類似度が閾値設定装置2よ
り与えられる閾値を越えた場合に、前記読み取り単語を
単語゛清報の単語に代えて出力する知識処理装置、5は
知識処理装置ルて利用する単語情報(単3n辞書)即ち
、単語単位の階層、頻度等の情報を保持するメイン知識
ベースである。
次に本実施例の動作について説明する。先ず、0CR1
は読み取った単語を候補文字行列と共に閾値設定装置2
に渡す。閾値設定装置2は、渡された単語を構成する文
字の発生頻度、各文字が連接する頻度及びおる文字を読
み取った時にどのような候補文字が立つかその確率を、
閾値設定用ベース3の文字の発生頻度情報、文字連接情
報及び文字別認識率情報により求め、更に前記単語の発
生頻度をメイン知識ベース5の単語の発生頻度清報から
求める。これにより、閾1i!設定装買2は、0CR1
によって読み取った単語を構成する文字のこの0CR1
による認識率の高低を判定する。
即ち、閾値設定装置2は0CRIの読み取り単語を構成
する文字の発生頻度、連接頻度、候補文字の立つ確率及
び前記単語の発生頻度が高ければ高い程、前記単語を構
成する文字の0CR1による認識率は高いと判断し、知
識処理装置4に設定する閾値を高くし、その逆の場合は
低くする動作を行なう。
知識処理装置4は、0CR1の読み取り単語及び候補文
字群とメイン知識ベース5の単語との類似度を同メイン
知識ベース5の単語単位の階フ、頻度゛購報を基にして
比較し、この類似度が前記閾値を越えるものがあれば、
前記読み取り単語に代えてメイン知識ベース5の単語(
少数の場合もある)を最終読み取り結果として出力する
本実施例によれば、0CR1によって読み取られた単語
を構成する文字の前記OCRによる認識率が高い場合に
は知識処理装置4の閾値を高くして、前記読み取り単語
を誤補正する確率を減らし、前記認識率が低い場合には
知識処理装置4の閾値を低くすることにより、前記読み
取り単語の補正を促進するため、最終読み取り結果の正
解率を向上させることができる。
[発明の効果] 以上記jホした如く本発明の閾値設定方式によれば、O
CRによる読み取り単語の構成文字の前記OCRによる
認識率の高低により、知識処理過程にあける閾値を変化
させることにより、最終的な文字認識率の向上を図るこ
とができる。
【図面の簡単な説明】
第1図は本発明を適用した閥値段定方式の一実施例を示
したブロック図でおる。 1・・・光学的文字認識装置(OCR)2・・・閾値設
定装置 訃・・閾値設定用知識ベース 4・・・知識処理装■ 5・・・メイン知識ベース 代理人 弁理士  則 近 憲 缶 周  山王 −

Claims (1)

    【特許請求の範囲】
  1. OCRの読み取り単語と単語辞書内の単語との類似度が
    閾値を越える場合、単語辞書からの単語を最終読み取り
    結果とするOCRの知識処理装置にあって、OCRによ
    る読み取り単語の構成文字の前記OCRによる認識率の
    高低を判定する判定手段と、前記判定手段の判定結果に
    対応して前記閾値を変化させる閾値設定手段とを具備し
    て成ることを特徴とする閾値設定方式。
JP61178811A 1986-07-31 1986-07-31 閾値設定方式 Pending JPS6336392A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61178811A JPS6336392A (ja) 1986-07-31 1986-07-31 閾値設定方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61178811A JPS6336392A (ja) 1986-07-31 1986-07-31 閾値設定方式

Publications (1)

Publication Number Publication Date
JPS6336392A true JPS6336392A (ja) 1988-02-17

Family

ID=16055070

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61178811A Pending JPS6336392A (ja) 1986-07-31 1986-07-31 閾値設定方式

Country Status (1)

Country Link
JP (1) JPS6336392A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02195489A (ja) * 1989-01-25 1990-08-02 Hitachi Ltd 文字認識の後処理装置
JP2014099114A (ja) * 2012-11-15 2014-05-29 Fujitsu Ltd 判定プログラム、判定方法及び判定装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02195489A (ja) * 1989-01-25 1990-08-02 Hitachi Ltd 文字認識の後処理装置
JP2014099114A (ja) * 2012-11-15 2014-05-29 Fujitsu Ltd 判定プログラム、判定方法及び判定装置

Similar Documents

Publication Publication Date Title
JPH0132554B2 (ja)
JPS6336392A (ja) 閾値設定方式
JPS59158482A (ja) 文字認識装置
JPS62298885A (ja) 光学文字読取り方式
JPS61114388A (ja) 文字入力装置
JP2942375B2 (ja) 文字読取装置
JPH01311390A (ja) 文字置換制御方式
JPS60138689A (ja) 文字認識方法
JP2886881B2 (ja) 手書文字認識装置
JPH0475557B2 (ja)
JPH0475556B2 (ja)
JPS59205681A (ja) 文字読取装置
JP3377719B2 (ja) 文字認識装置及びコンピュータ読み取り可能な記録媒体
JPS61251984A (ja) マルチフオント活字文字認識装置
JPS58200377A (ja) 光学的文字読取装置
JP2784004B2 (ja) 文字認識装置
JPS63208182A (ja) パタ−ン認識装置
JPS63228392A (ja) 文字認識方法
JPH0658694B2 (ja) 文字認識装置
JPH0212391A (ja) 文字認識方式
JPS6252886B2 (ja)
JPH0362280A (ja) 文字読取装置
JPS63280389A (ja) 文字読み取り装置
JPH0546806A (ja) 文字認識方法
JPH03147084A (ja) 類似文字識別方法